10.1.3 二次分析
二次分析也称为次级分析(元分析,再分析),即对第二手资料的分析,它是对他人收集的文献或资料进行再分析。广义上的二次分析或许包括内容分析,但是二次分析的资料一般是统计资料,因此,严格意义上的二次分析主要是对他人收集的统计资料进行再分析。二手统计资料可以分为原始数据和经过整理后的数据。原始数据是指他人收集的没有经过统计整理的数据,例如各种向公众开放的数据库[2];经过整理的数据一般以频数统计或分组统计的形式出现,例如由政府公布的各种统计资料[3]。因此,二次分析一般有两种情况,一是利用他人的统计资料来说明自己的观点,或者说在对他人统计资料再分析的基础上,通过新的分类对某个问题进行深入研究,最为典型的是涂尔干的《自杀论》研究。二是利用他人提供的或者向社会公开的社会调查数据库资料进行研究。近年来,我国不少研究成果就是利用数据库资料得出的,这些数据库有的是公开的,有的是半公开的。例如,《“丁字型”社会结构与“结构紧张”》(李强,2005) 、《社会分层、住房产权与居住质量——对中国“五普”数据分析》(边燕杰,刘勇利,2005) 、《当代中国家庭结构变动分析》(王跃生,2006a) 、 《当代中国城乡家庭结构变动比较》(王跃生,2006b )等主要是利用国家“五普”长表数据进行再研究。《阶层化:居住空间、生活方式、社会交往与阶层认同》(刘精明,李路路,2005) 、《高等教育扩展与入学机会差异:1978—2003 》 (刘精明,2006) 、《中国城市居民的社会网络资本与个人资本》(王卫东,2006) 、《渐进转型与激进转型在初职进入和代内流动上的不同模式》(梁玉成,2006)等研究成果的数据主要来自我国社会学界第一个公开的数据库——中国人民大学社会学系和香港科技大学社会调查中心合作主持的2003年度全国综合社会调查数据库(CGSS) 。
二次分析不管是利用原始数据还是利用经过初步整理的统计资料,其研究步骤基本上是一致的:①根据研究主题选择合适的资料;②在一定的理论架构下对资料进行再处理,尤其是原始数据还要根据研究需要进行再编码、分类统计以及其他统计分析;③根据统计分析的结果撰写研究报告。
二次分析的两个例子:
例10-5:《自杀论》——一项来自统计数据的研究
涂尔干的自杀研究资料主要来自欧洲一些国家政府机构发表的一些统计数据。最初的研究发现,在欧洲的许多国家中, 自杀率在一个比较长的时期里是相对稳定的,但是涂尔干发现在炎热的夏季里, 自杀率出现异常,表面来看温度似乎与自杀有关,但是发现温度比较高的国家,自杀率并不相应提高。他还发现自杀率在不同的年龄、性别中是有差异的,但是很难做出社会学的解释。进一步的研究发现,在政治动荡时期自杀率会上升,而且在许多欧洲国家都存在,由此建立有关自杀的一般性假设,即自杀率的高低与社会整合有关。进而通过对资料的分析,使这个一般性假设得到证明。例如,他注意到以基督教为主的国家中, 自杀率要高于天主教为主的国家,是什么原因造成宗教对自杀的影响?涂尔干将他在宗教上的发现和政治动荡的发现综合在一起,指出许多自杀与“失范”有关。在政治动荡时期, 旧的行为和道德规范被瓦解了, 自杀就成为对这种状况极端不适应的最后结果;天主教要比基督教具有更健全的结构和更整合的宗教系统,给人们以连贯和稳定的感觉, 因此天主教的自杀率就比较低(艾尔·巴比,2000a: 407-408) 。
例10-6: 《 “丁字型”社会结构与“结构紧张”》——一项来自原始数据的研究
李强在2005年关于“丁字型”社会结构形态的研究成果是我国社会结构研究的重要发现。研究数据来自2000年第五次全国人口普查的抽样数据,按0.95‰的比率采用系统抽样方法从全国总数据中抽取。该项研究运用“国际标准职业社会经济地位指数”、即ISEI,对我国“五普”抽样调查中的职业、教育、收入等变量进行标准化处理,获得了我国16~64岁人口的ISEI值。李强根据我国职业人口的ISEI值敏锐地发现中国的社会结构是“倒丁字型”的,即它的一横是巨大的农村社会阶层,一竖更多的是城市社会阶层,是非此即彼的二分式结构,他认为这样的社会结构会造成持续的“社会结构紧张”,即社会群体之间处于一种对立的、矛盾的或冲突的状态,社会关系处于一种很强的张力之中,社会矛盾容易激化,社会问题和社会危机容易发生。因此,李强的研究结果如果被确认的话,将会在某种程度上颠覆学术界对中国社会结构的认识和判断,即认为中国的社会结构正在从“金字塔型”向“橄榄型”过渡,也就是说,中国的社会结构还不是“金字塔型”,首先要过渡到“金字塔型”,才能转变为“橄榄型”。