变量测量与模型选择

(二)变量测量与模型选择

在定量研究中,因变量为教育机会,用适龄随迁子女的在学情况来测量,具体包括3~18岁随迁子女的在学情况、3~6岁幼儿园适龄随迁子女的在学情况、7~15岁义务教育适龄随迁子女的在学情况、16~18岁高中适龄随迁子女的在学情况。[2]它们均为二分类变量,1代表适龄随迁子女在学,0代表适龄随迁子女不在学。鉴于因变量的测量层次,采用二分类的Logistic回归模型。此外,考虑到问卷调查采用的是PPS抽样方法,同一层次的样本之间可能不完全独立。为控制各城市样本之间的聚类性,本文采用稳健标准误加以应对。

自变量为家庭的经济资本、文化资本和社会资本。根据布迪厄(1986)对三类资本的界定,李春玲(2003,2010)、陈友华等(2007)的相关研究,结合使用的定量数据,用家庭月收入测量经济资本(在模型中用收入的自然对数),用父母教育程度测量文化资本。随迁子女家庭社会资本的多少,不仅取决于其家庭社会网络结构,还取决于社会网络中每个个体所拥有的经济资本、文化资本和社会资本在内的资本数量的多少。从这个角度看,流动人口在流入地的主要邻居是测量其社会资本的较好指标。原因有二:一是该指标可测量社会网络结构,若流动人口的主要邻居为本地人,则其社会网络结构中很可能包括本地人和流动人口两类人群,若流动人口的主要邻居为外地人,则其社会网络结构中很可能只有流动人口一类人群;二是该指标能测量出社会网络中每个个体所拥有的各类资本的多少,相对而言,本地人所拥有的经济资本、文化资本和社会资本数量普遍多于流动人口。

控制变量包括父母职业、父母流入(所在)城市、流动范围、父母(在流入地的)居住时间、户籍类型、兄弟姐妹数量、性别、年龄等。

表1 因变量和自变量的定义及其分布

img

续表:

img