7.6.3 累积量表

7.6.3 累积量表

累积量表也称为戈特曼量表,是戈特曼(L. Guttman)在1944年设计使用的。针对总加量表是对一个复杂概念的多维度测量的结果,但不能在态度得分上分析人们态度结构的差异这一局限,累积量表是单维的,也就是说累积量表的语句结构中内含着非常严格的由强变弱或由弱变强的逻辑关系。被测试者对上一条语句的回答决定了他对下一条语句的选择。例如,对于妇女人工流产态度的测量,既可以采用总加量表的方法进行测量(见表7-5) ,也可以采用累积量表的方法(见表7-6) (林南,1987: 212-213)。

比较妇女人工流产态度的两种量表形式,可以发现虽然总加量表和累积量表的语句结构都有其内在的逻辑关系,但是累积量表的语句逻辑更为严密。在表7-5中,当被测试者同意第1条语句“任何妇女要求堕胎都应许可”,在逻辑上应该同意第3条语句“男女平等,妇女自己有权决定他们是否愿意要孩子,所以堕胎是应该准许的。”而对于第2条和第4条语句表示“不同意”或者表示“没意见”都不与之矛盾。但是,在表7-6中,如果你同意上面一条语句,在逻辑上必须同意下面一条语句,或者被测试者只有在对上面的语句表示“反对”时,又对下面的语句也选择“反对”或“同意”才不矛盾。

表7-5 妇女人工流产总加量表

表7-6 妇女人工流产累积量表

观察表7-5和表7-6,可以发现总加量表和累积量表的差异: (1)总加量表的回答类别虽然可以是两个、三个、五个,甚至更多,但是大多数是采用五个类别的回答;累积量表的回答类别只能是两个。 (2)累积量表要比总加量表的语句结构更具有严密的逻辑关系。 (3)累积量表的语句是单向的,而总加量表的语句可以是单向的,也可以是双向的。另外,从量表的制作方法来说,总加量表需要经过试验性测试确定正式量表,测试结果不影响量表能否成立;而累积量表不需要经过试验性测试,设计完毕后就可以直接用于正式测试,然后根据测试结果决定量表能否成立或者测试是否成功。因此,总加量表是一种“事前量表”,累积量表是一种“事后量表”。

鲍格达斯社会距离量表(Bogardus social distance scale ) ,是美国社会心理学家鲍格达斯于1925年设计的,用于测量美国的种族关系。由于鲍格达斯社会距离量表先于后来被命名的“戈特曼量表”,即累积量表,很多教材把它单列为一种量表类型。但笔者认为,鲍格达斯社会距离量表的形式实际上就是累积量表(见表7-7) (克特·W.巴克,1984: 254) ,语句的设计从第一句到第七句,实际上是根据“最亲近—最疏远”或“接近—拒斥”的逻辑关系测量白人和黑人之间的种族融合或排斥的价值取向。修改后的鲍格达斯社会距离量表应该说是典型的累积量表的形式(见表7-8) (风笑天,2001: 99 ) 。根据表7-7进行测量,如果同意的话,就给1分,不同意给0分,分数越高,越是倾向于种族相融。

累积量表的语句设计最为关键的是要确定一个维度,并且只能按照一个维度设计语句,即在一个层面上设计语句。例如,妇女人工流产的语句层面是妇女或胎儿健康对人工流产的影响,社会距离量表的语句层面是空间关系的亲近和疏远。

表7-7 鲍格达斯社会距离量表A

表7-8 鲍格达斯社会距离量表B

累积量表的设计步骤如下:

(1)根据累积量表的语句结构提出具体的语句或项目。

(2)进行正式测试。

(3)根据测试结果按照得分由高到低排列,并且分为量表和非量表两种回答类型。量表类型回答是指被测试者严格按照语句的内在逻辑回答,非量表类型回答则相反。

(4)计算一致性系数或复制系数,并依此决定量表能否成立。一般而言, 当复制系数大于或等于0.9时,量表就可以成立。

例如,对于妇女人工流产态度的累积量表测试,按照语句的逻辑,通过率最高的是“孕妇或胎儿在生命有危险时可以堕胎”,其次是“孕妇在胎儿有残废倾向时可以堕胎”,以下依次类推。假如经过对250人调查,其中赞同“孕妇或胎儿在生命有危险时可以堕胎”占82.8%,赞同“孕妇在胎儿有残废倾向时可以堕胎”占80.4%,赞同“孕妇在身心健康受影响的情况下,可以堕胎”占66.8%,赞同“任何妇女都可要求堕胎”占44.0%。其中量表类型回答人数185人,非量表类型回答人数65人。经计算,复制系数为0.93,即妇女人工流产态度量表成立(见表7-9) 。

表7-9 复制系数计算举例

在进行累积量表分析时,首先按照量表得分由高到低排列,然后在肯定回答(+)和否定回答(-)之间用阶梯线一分为二,凡是在肯定回答区域中出现否定回答,如表中F, G, H, I, J, K类型,或者在否定回答区域出现肯定回答,如表中L, M, N, O类型,都属于误答,然后每个类型中误答数乘以回答人数,总加后即为总误答数。其次,对于非量表类型分析,主要根据语句的回答逻辑,按照最容易通过到最不容易通过的标准进行归类,在本例中,第四条语句是最容易通过的,依此类推。例如,表中F, G, H回答类型,不容易通过的语句都通过了,即得到了肯定回答,而在逻辑上容易通过的语句却没有得到肯定回答,在逻辑上应该视为是肯定回答的。因此,虽然指标得分即测量结果是3分,但是量表得分仍可视为4分。M, N, O回答类型的情况则有些不同,不容易通过的语句较少,最多是2分,可以视为测试者的回答是错误的,如M回答类型,虽然指标得分是2分,但量表得分只能是0分,因为当第1、第2条语句得到肯定回答的话,之后的语句在逻辑上应该是肯定的,现在出现相反的情况(即最容易通过的反而没有通过),只能认为测试者对第1、第2条语句的回答是错误的。第三,在分析非量表类型时,如果遇到不能判断的回答类型就可以舍去。如果从第4条语句到第1条语句出现“-、 +、 -、+”回答类型,就很难判断,这时可以舍去[3]

虽然单向性的累积量表中,语句之间具有严格的逻辑关系,能够比较准确地测试出人们的态度,但是累积量表仍然具有它的局限性。由于量表语句同时具有单向性和严密的逻辑关系,一方面不能测量概念的多种维度或者不能在不同层面上测量同一概念,另一方面累积量表语句的回答是按照从最不容易通过到最容易通过的原则设计的,因此量表语句表现为逐步收敛的特征,语句不会太多,可能会影响到测量的信度。第三,利用累积量表进行测试,对于被测试者的教育水平具有一定的要求,如果被测试者不能理解语句的逻辑关系,就有可能出现大量的“误答”,最后不能达到复制系数的临界值,导致测试失败。也就是说,由于累积量表是一种“事后量表”,即使量表的设计完美无缺,也可能由于被测试者的理解能力有限,导致量表不能成立,从而浪费大量的人力、物力和财力。由于以上局限,累积量表在调查研究中使用不多,或者只能在教育水平较高的群体中实施。