研究方法与数据

一、研究方法与数据

主成分分析法是把反映样本某项特征的多个指标变量转化为少数几个综合变量的多元统计方法(侯景新、尹卫红,2004),找到几个新的综合指标,可以达到既减少指标量又能区分区域间差异的目的,是研究区域经济问题的常用分析方法,它与因子分析法有类似之处,但又有所区别。主成分分析是从解释变量的方差出发,并假定变量的方差能够完全被主成分解释;而因子分析是从分析变量的相关关系出发,并假定变量间的相关关系能够完全被公因子解释。当公因子方差为1时,两种方法实质一样。张伦俊、申山宏(2007),梁红梅、邹晖(2010)在对税收收入差异进行分析时都采用了因子分析法。而在统计软件SPSS中,主成分分析是因子分析的方法之一。所以,本章将运用主成分分析法,选取2012年中国31个省、直辖市、自治区的相关数据指标来分析产业发展对区域财政收入差异的影响。

相比截面数据,面板数据模型可以控制不可观测经济变量所引起的OLS估计偏差;相比时间序列模型,面板数据模型扩大了样本信息、降低了经济变量之间的共线性,提高了估计量的有效性并能准确地反映经济变量的动态调整(白仲林,2008)。根据2003—2012年各地区的面板数据,运用Stata统计分析软件,先构造出固定效应模型(Fixed Effects Regression Model)和随机效应模型(Random Effects Regression Model),再利用相关检验来确定最合适的模型以讨论区域间不同产业人均产出与人均财政收入的关系。

我们进而对区域财政收入差异的关键因素营业税做进一步分析。我们还将采用基尼系数分解法,即式(4.2)对2003—2011年营业税的产业、行业和企业差距进行讨论,并选取2000—2011年区域间营业税收入基尼系数和房地产及建筑业总的营业税收入的时间序列数据,找出二者间的长期协整关系。常用的单位根检验方法有ADF检验、PP检验和KPSS检验,本章采用运用最普遍的ADF检验来判定数据平稳性。常用的协整检验方法有基于回归残差的EG两步法和基于回归系数完全信息的Johansen检验。针对两变量系统,这两种方法都适用,但是Johansen检验操作上较为方便,鉴于此,本章采用此方法估计协整方程。

本章数据来源于2001—2013年《中国统计年鉴》和2001—2012年《中国税务年鉴》。