(一)聚类分析

(一)聚类分析

为了更完整地反映区域财政收入差异,我们将进一步按照各省、直辖市、自治区的经济发展情况,对31个地区进行分类,进而研究经济区域间的财政收入差异。我们以2012年各地区三次产业人均GDP作为原始数据,采用层次聚类法进行分析。其中,求新类相似性的方法和相似性测度方法不同会导致分类结果的不同。求新类相似性时,我们采用最短距离法(Nearest Neighbor)这一应用最为广泛的方法;进行相似性测度时,我们将分别采用平方欧式距离法(Squared Euclidean Distance)和夹角余弦(Cosine)进行距离测度和相关测度。距离测度衡量的是样本之间综合的距离远近程度,适用于把握总体特征;相关测度衡量的是样本之间结构上的相似程度,适用于分析结构特征。

按照测算结果中的谱系图(Dendrogram),距离测度将31个地区分成了七类,相关测度则将所有地区分成了五类。经济区域划分结果见表3.5。

从表3.5可以看到,如果按照总体经济特征分类,中西部省份除内蒙古外全部位于第三类区域,除河北外,其他10个东部省份则分别属于其余的六类经济区域。经济总体水平位于我国前列的北京、天津、上海和海南各成一类。经济总体水平较高的江苏和浙江为第六类,其次是西部的内蒙古和东部的辽宁、福建、山东、广东为第四类。这个分类结果基本展示了不同地区经济发展水平的总体差异。如果按照结构特征分类,北京、上海、海南各成一类,贵州和西藏属于第五类,剩下的所有省份都属于第二类。仔细对比三次产业人均GDP数据可以发现,北京的第二产业人均GDP比第一产业高出26倍,同时第三产业的人均GDP达到第二产业的近2.4倍;而上海尽管第二产业比第一产业高出60倍以上,但第三产业比第二产业只高出0.5倍;与前面两个直辖市不同,海南的第一产业和第二产业人均GDP非常接近;贵州和西藏的第二产业人均GDP较第一产业高出2倍,而第三产业较第二产业仅高出0.23倍和0.56倍,三次产业之间差距相对来说并不突出。第二类区域中所有省份的第三产业人均GDP都高出第二产业。因此,这个分类结果能够充分反映各省、直辖市、自治区产业结构的现实情况。

表3.5 经济区域划分结果