准实验

准实验

对于准实验没有一个精确的界定。大约说来,准实验是没有进行严格实验控制的、任何关于因果作用的实证研究。未经严格实验控制的原因,可能由于调查者没有直接操纵自变量,以及/或者可能会影响结果的额外变量没有得到充分控制。由于不完全的操纵与/或控制,对准实验结果的解释不像对照实验那样有信心,但是有时依然可以得到确定的结论。

最常见的准实验研究设计是不等组设计(non-equivalent group)。调查者并不对自变量进行操纵,而是比较在自变量上存在不同的组之间的差异。在这种研究设计中,除了在研究所感兴趣的自变量上,组间还可能在其他方面也存在差异,这会限制对结果的解释。典型的例子是我们讨论过的测验中的问题4,考查年龄对于问题解决能力的影响,这些问题与对物质守恒定律的理解有关。问题在于,儿童的认知发展水平是兴趣的原因,而前者是不能由调查者操纵改变的。但是,认知发展的水平很大程度上取决于年龄,因此调查者可以直接控制年龄,比较不同年龄阶段的孩子的问题解决能力。但是除了认知发展水平之外,不同年龄段的孩子在其他方面也会有差异。比如,总体上更小的孩子接受的教育更少。当然,在比较不同年龄段的孩子的思维过程时,调查者可以使教育与其他额外变量保持恒定。换言之,调查者虽然不能比较不同认知水平的孩子,但可以使孩子们在其他方面保持一致。通过对守恒能力的客观测量,依旧有可能研究经精心划分的不同年龄段孩子的思维过程。

这类研究之所以称作准实验研究,是因为对相关变量的操纵或控制不完全。准实验研究的结果不如对照实验的结果那样具有确定性,需要慎重对待。在许多情况下,常识使我们相信结论是有效的。比如,皮亚杰的守恒实验中,不能完成守恒作业任务的孩子很有可能是由于认知的不成熟造成的。但在其他情况下,对结果的解释会带来很严重的问题。

不等组设计会带来解释的问题,一个最著名的例子是对不同种族间智力差异的研究,特别是在美国白人和黑人之间。许多研究都表明,在标准的智商测验上,美国黑人的平均得分与他们的白人同胞相比,大约低15个百分点。一些心理学家认为,智商的这种差距很大程度上是由遗传的原因造成的;但有些人则相信可以用环境的因素来解释。但是遗传学的假设不可能用对照实验来检验,因为把遗传的因素从其他背景因素中分离出来是不可能的。对于这个问题,对照实验的做法应该是将“黑”与“白”的基因分配给一组新生儿,让他们在完全相同的环境条件下成长,然后再测他们的智商。这样的实验显然不可能实施,因此意识形态就会影响对现存相关的解释。

在准实验研究中,有时候可以在数据收集完成以后,通过统计的方法,间接控制一个或多个额外变量。一个有影响的例子是1975年发表的,对乳癌发展期妇女的人格特征进行的调查。对160名患有乳腺囊肿的女性,在她们即将接受手术检测以判断囊肿是否是恶性的前一天,进行访谈和多种人格测验调查。调查的时候,无论那些妇女,还是调查者都不知道囊肿的性质。手术后,69名妇女经检测证实患乳癌,另外91名妇女的囊肿则是良性的。然后调查者比较两组妇女的人格特点发现,最显著的差别是妇女们表达愤怒情绪的方式。在“极端抑制型”(从来没有公开表达愤怒)与“极端表达型”(经常发脾气)的妇女中,67%的人患恶性囊肿,即乳癌;而“正常”表达愤怒的女性中只有23%的人患恶性囊肿。统计分析(将在后面的内容中讨论)表明,差异达到不像是由偶然因素造成的水平,也就是说结果具有统计意义上的显著性差异。

但是上述结果在心理学上具有显著意义吗?是否说明在人格与乳癌之间具有因果联系?由于调查采用的是不等组的准实验设计,这种结论是不确定的,结果也可能是由任何其他额外变量造成。调查者预见到这个问题,于是检验了最重要的一个额外变量,也就是妇女的年龄。在平均水平上,患恶性囊肿妇女的年龄高于那些患良性囊肿的妇女。这暗示着,也许人格与乳癌之间的关联完全是年龄的缘故造成:当女性逐渐变老,她们表达愤怒的方式会变得越来越极端,因此更容易患上乳癌。因此,研究者间接控制了年龄因素,对不同年龄组的女性重新分析结果。结果依旧具有统计上的显著意义,尽管年龄的影响已被部分排除。但即使是改进的实验结果仍不能证实在人格与乳癌之间存在因果联系。因为其他未知的或未加控制的额外变量可能会起部分作用,这样的实验设计不能保证它们的影响已被排除。

准实验研究不能得出确定的因果关系。在某些情况下,结果仅仅是无法解释的。在另一些情况下,对照实验设计的缺点也不是问题,因为仅仅基于常识,就能做出合理的、确定的判断。在任何情况下,不管心理学家喜欢与否,他们都不得不接受这些研究方法。因为推测的因果关系通常需要通过对自变量的操纵、对额外变量的控制来检验。