2.模型与数据
2.1 模型设定
我们首先通过(3-1)式来分别求出我国城镇与农村代际收入弹性的估计值β,其次,分别求出父代收入对各个中间因素的影响((5-5)式),以及各个中间变量对子代收入的影响((5-6)式),

式中,ΙΝj,i表示中间变量;j=1,2,3,分别代表人力资本、社会资本和财富资本。由于(5-5)式和(5-6)式分别表示了父代通过对不同种类的资本投资、进而通过子代收入取得回报的过程,故我们分别将其简称为投资方程与回报方程,而λj和θj则分别简称投资系数和回报率,
各中间变量对代际收入流动性的解释力就取决于这两者的大小,即代际收入弹性的估计值β满足10,

三个中间变量对代际收入流动性的贡献τj,和总的解释力τ分别为,

2.2 数据、变量与统计描述
本章的数据来源为1988年、1995年和2002年中国家庭收入调查(CHIPS),以及2006年中国社会综合调查(CGSS),所指的收入仍是包括现金和实物在内的个人工资性收入11。其他变量的含义如下:
首先,人力资本通过子代的受教育年限衡量。广义人力资本包括一切能影响到在劳动力市场中获取报酬的能力,例如健康、习惯、性格等,而教育既是易观测的人力资本衡量方法,也是与公共政策联系最为密切的指标,故本书用受教育年限代表人力资本12。
其次,社会资本的定义和衡量也较为复杂,本书用对我国社会资本有较大影响的四个指标来表示,包括政治身份、单位性质、职业和行业,各自的具体含义为:① 政治身份,为虚拟变量,党员=1;② 单位性质,国有部门=1,包括党政机关事业单位、国有企业和集体企业;③ 职业,各个子样本之间有一定差异,尽量按照各种单位的管理者、技术人员、私营个体企业主、办事人员、工人、服务人员、领取工资的农业工人和其他这7种大类分为7类,按此顺序分别赋予1—7的值;④行业,按照农业、工业、一般服务业、科教文卫与党政社团的分类,分别赋予1—4的值。进一步通过对这四个变量的主成分分析,选取其主成分作为社会资本的代表,该主成分对4个指标的代表性在两个数据库中分别达到了37.3%(CHIPS)和41.8%(CGSS),在这4个变量上的系数(factor loading)分别为0.28,0.46,0.58,0.61(CHIPS)和0.45,0.23,0.64,0.59(CGSS)。
最后,在财富资本方面,按照CHIPS数据结构,中国城镇居民的家庭总财产由六个部分构成:房产、金融资产(银行存款、债券、股票等)、耐久消费品、债务、生产性资产和其他财产;农村居民则在此之外还有土地财产。本书主要研究其中的房屋、土地和金融资产对代际收入流动性的影响,因为这三项不仅是中国居民家庭财产的最主要构成部分,还与正在进行的相关体制改革密切相关,从而具有重要的政策意义。另外,它们在CHIPS各年的城乡数据统计中也较其他财产项目更为一致和完整13。
在此基础上,我们选取了所需信息完整的个体,同时删除了父代年龄大于65岁、子代年龄小于20岁和不在就业的样本,以及父子年龄差距小于10岁、工资性收入为负的异常样本。同时,所有收入和财富资本的数据都用各省城乡的消费品物价指数(CPI)调整为2002年的真实值,并删除了上下各0.5%的极值。表5.1汇报了主要变量的统计信息。
表5.1 主要变量的描述性统计信息(机制分解)

续表

注:所有收入和财产价值都为经分省的城乡CPI调整过的2002年真实值的对数。土地面积也是对数值。部分子样本中缺失家庭财产方面的信息。为节约篇幅,省略了用于生成社会资本主成分的原始变量信息,欢迎感兴趣的读者来信索取。