附录3.C 对收入变量的补充说明

附录3.C 对收入变量的补充说明

本附录旨在对本书收入变量的具体内涵和生成过程进行详细的补充说明。

工资性收入和总收入定义的基本原则是:个人工资性收入指通过市场劳动获得的工资性现金和实物收入,按问卷中可能做到的最细致和精确的统计口径来统计,无法分割的部分都不放入;个人总收入中则包含了所有可以分割到个人的收入(各子样本略有差异)。具体如下(下述内容都来自对应的问卷):

1.CHIPS(1988)农村

1.1 个人收入栏的说明

家庭成员的工资收入状况。从单位(包括国营、集体、私营个体合资、外资企事业)领取工资的家庭成员请回答以下问题,无工资收入的家庭成员所在栏留空。

1.2 工资性收入

一般收入(各种工资津贴补贴补助福利费奖金)、从单位获得的其他收入、其他劳动现金收入、从单位获得的实物收入净值。

1.3 总收入

增加:非经常性收入(包括独生子女费、一次性补贴、奖金、稿费等)。

需要指出的是,这一收入中也包含了部分劳动收入,但无法具体区分出来;而且1988年没有关于个体经营的信息。且1988年对于非常性收入的定义更接近于非工资性收入,而1995年则更接近工资性收入,故区别对待。

2.CHIPS(1988)城镇

2.1 个人收入栏的说明

职业收入。请有收入的家庭成员回答下列问题。

2.2 工资性收入

标准工作、浮动工资、各种奖金超额工资、各种津贴补贴、其他工资、从单位得到的其他现金收入、其他劳动收入。

2.3 总收入

增加:承包收入、生活困难补助、票证价值、实物收入,对私营企业雇主,还增加净利润收入。

3.CHIPS(1995)农村

3.1 个人收入栏的说明

住户成员的个人劳动报酬收入,包含长期在外打工家庭成员的收入,但是不包括家庭经营收入。

3.2 工资性收入

职工从单位领取的固定收入、其他职业的收入、从单位领取实物收入估计净额、非经常性收入(承包收入、一次性奖金、销售提成、年终奖等)、从家庭经营之外获得的其他现金收入,对乡村干部,还包括乡村干部的工资和补贴。

3.3 总收入

增加:除其他职业收入之外的从其他途径获得的现金收入、在外打工成员汇回或带回的收入。对于个体户,增加:从个体经营私营企业和合营企业中获取的个人净收入。

4.CHIPS(1995)城镇

4.1 个人收入栏的说明

个人全年现期收入,请有收入的住户成员回答下列问题。

4.2 工资性收入

职工工资、从单位获得的其他收入、个体被雇者收入、其他就业者收入、其他劳动收入。

4.3 总收入

增加:财产性收入、转移收入、家庭副业生产收入,并减去个人所得税。对个体户主和私营企业主,增加:净收入。

5.CHIPS(2002)农村

5.1 个人收入栏的说明

从事工资性就业和个体非农经营的家庭成员的收入。

5.2 工资性收入

个人工资性收入总额、实物收入。

5.3 总收入

增加:实物与退休收入之外的个人非工资性收入总额(以个人名义取得的)。

6.CHIPS(2002)

6.1 工资性收入

工薪收入。

6.2 总收入

增加:增加财产性收入、转移性收入,并减去所得税;对个体户主和私营企业主,增加净收入。

7.CGSS(2006)

子代:工资收入;父代:总收入

8.CHNS

工资和奖金(只在养父子收入相关性的估计中涉及此数据)。

注 释:

1 附录3.B对这些基本模型的设定和结论进行了整理总结。本章正文中所用的模型来自Solon(1999)基于Becker and Tomes(1979)模型的简化分析,是研究代际收入流动性的第一个、也是最基础的经济学理论模型,而后续章节将逐步介绍对此模型的诸多扩展。例如,第4章将讨论IIE的测量误差问题,第5章将指出从因果关系意义上解释代际收入弹性的困难和现有的计量方法,第6章将引入效率和公平、分析在人力资本回报非外生的情况下流动性与经济增长和收入差距的关系,第7章将进一步引入公共教育等公共政策等。

2 一生收入的难以观测是对代际收入弹性进行准确测量的难点,用单年收入求出的代际收入弹性估计值往往会存在向下的估计偏误,但这不会对本书识别代际收入流动性时间趋势的主要结论产生影响,本书第4章将通过计算此处的估计偏误,对中国代际流动性程度进行更精确的测量。

3 对这两个数据库的基本介绍请参见导论第三节。CHIPS被认为是目前关于中国微观收入的最全面和严格的公开数据库,但是由于其只包含1989年、1995年和2002三年,故此处用了CGSS(2006)作为补充。另外需要说明的是,CGSS(2006)中统计的父子代收入均是针对2005年的。

4 这里涉及代际收入流动性研究中的性别差异、匹配性婚姻和“家庭收入”的衡量问题。首先,本书的绝大部分内容通过在方程中放入子代的性别来控制儿子和女儿的差异,这主要是由于本书的关注点在于劳动力市场收入的代际流动性,故只需通过包含性别变量来控制性别工资差异,同时,也是为了最大限度的利用现有较小的样本量。其次,在父代收入的指标选取上,一方面,用父亲的收入代表父代整体收入是现有研究的惯例(Black and Devereux,2011),用此方法更便于和现有的类似研究进行国际比较;另一方面,倘若使用父母收入之和作为父代收入,会进一步缩小现有并不大的有效样本量。事实上,代际收入流动性研究关注的是子代成长时的家庭物质资源对其成年后收入的影响,现有公开数据都未能满足这一要求,故只能用父亲、母亲或家庭的收入来作为代表;由于一般认为家庭的很多决策都会与一生收入相关,故现有研究大都关注父代的一生收入。最后,CHIPS中的父子配对根据与户主的关系这一核心变量产生,由于绝大多数满足要求的样本都以父代为户主,而以子代为户主的样本相对很少,故本书选自CHIPS的样本都来自以父代为户主的样本家庭;这可能会导致一定程度的样本选择偏误,但是我们用子代的收入、教育、职业、行业、单位性质等基本个人特征对是否是子代户主作回归,这些系数都不显著,表明这些基本特征并未对子代是否过早成立独立家庭有显著影响,故本书的结果还是比较稳健的。

5 对父子年龄差距的控制主要是为了删除少数可能存在汇报错误的样本。对年龄其他方面的严格控制,一方面是由于本书的研究对象是劳动力市场中的工资性收入,因此需要以劳动年龄人口为主;另一方面,也是由于不同年龄阶段的单年收入对一生收入的代表性有很大差异,本书第4章将对此进行详细阐述。本书的这些处理和Gong等(2010)等运用中国微观数据的研究一致。

6 唯一的例外是CGSS(2006)数据中采用了父亲的总收入,因为该数据库没有父亲的工资性收入信息。同时,我们将在第三节中采用各种不同的收入口径,对主要结论做稳健性检验。

7 收入变量的生成和相关更详细信息请参见附录3.B。

8 本章从时间、城乡、性别、体制内外等多个角度进行的代际收入流动性研究,其实都可以看做是对不同子样本的分析。对于不同子样本的系数差异是否显著,笔者都使用stata中的“suest”和“test”命令进行了检验,虽然显著性程度从接近0到接近0.1不等,例如,儿子和女儿的系数差异Prob>chi2=0.000 8;2002年和1995年系数差异的Prob>chi2=0.002 6;2002年和1988年为0.032 7;1988年和1995年为0.073 3,等等。但是这些系数差异都至少在10%的水平上显著;采用分组变量与父代收入的交叉项所得到的结论也类似。限于篇幅,没有对这些结果进行一一汇报,可按要求提供。

9 图3.1至图3.8的具体回归结果见附录3.A中对应的附表3.A.1至附表3.A.8。

10 对新增控制变量的说明:① 教育,除1988年外,直接使用汇报的受教育年份,1988年没有受教育年份,用受教育程度近似生成;②职业,各个子样本之间有一定差异,尽量按照各种单位的管理者、技术人员、私营个体企业主、办事人员、工人、服务人员、农民和其他这7种大类分为7类,按此顺序分别赋予1-7的值,进一步依照此变量产生一组(7个)虚拟变量;③ 行业,按照农业、工业、一般服务业、科教文卫与党政社团的分类,分别赋予1-4的值;④ 工作单位性质,国有部门=1,包括党政机关事业单位、国有企业和集体企业。

11 本书第八章有对这一问题和不足的更详尽说明。

12 由于数据和重点关注内容所限,我们此处未能对匹配性婚姻和性别差异方面的内容进行详细阐释,这将是之后的研究方向。

13 由于CGSS(2006)中没有母亲收入的信息,故此处只有1988年,1995年和2002三年的情况。

14 部门以父代的工作单位性质为准划分,体制内部门包括党政机关事业单位、国有企业和集体企业。

15 东、中、西地区的划分如下。① 东部:北京,天津,河北,辽宁,上海,江苏,浙江,福建,山东,广东。② 中部:山西,吉林,黑龙江,安徽,江西,河南,湖北,湖南,海南。③ 西部:内蒙古,广西,重庆,四川,贵州,云南,陕西,甘肃,宁夏,新疆。[CGSS(2006)包含了完整的这些省份;CHIPS各年样本稍有差异,具体见本书第1章第三节数据来源部分的详细说明]。

16 需要指出的是,分位回归不同于本章第一节中高低收入分组的分析。此处是针对子代收入分布的不同位置,以观察在不同收入分布的子代对其父代收入的依赖性;而第一节中是针对父代的收入中位数划分的收入分组,强调不同收入阶层和背景对其子代收入的影响程度差异。

17 Solon(1999)的分析即基于对该模型的简化和改写,详见本书第3章第一节。

18 这一设定暗含的假设:父代关心所有子代的总体特征,且这一特征用子代的经济财富代表(用子代效用代表的假设对结果改变不大,只是推导过程更复杂);不考虑收入的生命周期分布。

19 Black and Devereux(2011)的理论部分即基于该模型。