对照实验

2025年09月10日

版权

对照实验

对照实验法是一种极重要的研究方法。一些人相信，对照实验与其他研究方法相比更客观、更精确。但它的重要性与此无关。事实上，调查法、准实验研究、相关研究甚至是个案研究法都能非常客观与精确。对照实验的重要性在于它能确立因果关系，并且在一定的置信度上检验显著性水平，这是其他任何研究方法不可能做到的。测验中的大部分问题都是基于实验研究的发现提出的。

对照实验的主要特征是操纵与控制。为了弄清因果作用关系，实验者需要单独操纵猜想的原因（自变量），也就是说，同时控制其他所有可能影响结果的额外变量。举个例子，假设一位实验者想要检验这样的因果假设：连续几晚剥夺快速眼动睡眠（REM）会导致随后的REM活动量增加（快速眼动回弹效应），说明快速眼动睡眠能实现一些重要的生理与心理功能。操纵自变量的简单方法是将人们随机分配到实验组与控制组中。剥夺实验组的REM：连续几个晚上只要被试出现快速眼动就叫醒他们，然后让他们继续睡觉。随后的几晚，实验者就可以比较实验组与控制组的REM活动量。控制组的被试没有被剥夺REM睡眠，除此以外，其他实验条件完全相同，包括每晚被叫醒的频率都一样。如果观察到两组被试在因变量（REM活动量）上具有任何统计意义上的显著差异，就可以有把握地把差异归因于自变量。因为其他的变量都保持恒定。许多实验都报告说，快速眼动回弹效应事实上确实存在。

用物理学气体定律的一个例子可以阐明对照实验中控制的重要性。波义尔定律预测，如果气体被压缩，那么其压力会成比例地增长。查尔斯定律预测，如果气体的温度下降，那么它的压力会成比例增长。现在关键问题在于，如果不控制额外变量根本无法实际检验两种预测。检验波义耳定律，实验者必须操纵自变量（气体的体积），观察对因变量（压力）的影响。但是如果额外变量（温度）不加控制或使之保持恒定，就不能得出确定的结论。同样，查尔斯定律也需要在控制额外变量（体积）的同时，操纵自变量（温度）观察对因变量（压力）的影响。这是相当简单、显而易见的例子。因为会对结果产生影响的变量很少，而且它们的影响很容易理解。但是心理学的问题很少有这么简单的。

在一个严格的对照实验中，对自变量进行操纵的同时需要控制所有的额外变量。这是可以确保观察所得的显著效应是由自变量引起的唯一的途径。在气体定律的例子中，实验控制相对来说比较简单。气体的压力只取决于两个变量，体积和温度。因此当操纵一个变量时，只需要控制一个（额外）变量。在一些心理学的实验中（比如，测验中的问题9与问题11），类似这样简单又直接的控制也是有可能的。有时候，自然状态就提供了必需的控制。例如，在研究心理特征发展中天性与教养的相对影响时，心理学家常常利用同卵双生子来进行“自然的实验”。同卵双生子是指当一个精子使一个卵子受精后，分成两部分，最终成长为两个独立地个体。每一个体拥有完全相同的基因，因此他/她们必然有相同的性别，而且在所有遗传特征上具有相似性。他/她们之间的任何差异可以完全归因于环境因素的影响。因此，研究成长于不同环境中的同卵双生子，对估计环境因素在智力、人格以及个体差异上的相对重要性是非常有用的。双生子研究有很强的控制，因为所有额外的遗传因素都严格地保持恒定。但却并不是彻底实验性的：实验者并不是独立地操纵自变量（环境），这会给结果的解释带来问题。说得更明确些，很少有从出生就分开抚养的同卵双生子，而且如果有也是在类似的家庭环境中，使问题变得相当混乱。这意味着，同卵双生子之间的心理相似性可能由于他们相似的环境造成，而不是共有的基因。

心理学中有两大类型的对照实验，称作实验室实验（laboratory experiment）和现场实验（field experiment）。实验室实验是到目前为止较为普遍的类型，在实验室的条件下进行。在实验室里，通常在联机计算机的帮助下，可以方便、有效地操纵自变量，控制额外变量。现场实验在自然环境下进行，它的自然现实性更高但是实验控制更难。测验中解决大部分问题的实验研究都是实验室实验，但是第20题（紧急情况时的帮助行为）的有关研究是现场实验。社会心理学的某些特定领域常常采用现场实验研究。

对照实验是现行可用的最有效的研究方法，但它并不会自动消除解释上存在的问题。需要考虑三种效度。第一，如果实验设计恰当，那么结果的内部效度应该很高。这仅仅意味着，在实验所采用的方法与选取的被试范围内，所得的结论是真实的。第二种称作外部效度，是指当采用不同的方法与被试时，结论在多大程度上依然站得住脚。为了证实结果的外部效度，一般需要使用不同的方法和被试重复实验。第三种称作生态学效度，是指结论外推到自然（非实验）环境中的置信度。三种效度构成一个等级体系：实验可能产生内部效度高，但是外部效度与生态学效度低的结论；或者结论的内部效度与外部效度高，但生态学效度低。如果没有较低的效度，则不可能得到较高的效度。

任何实验的效度首先取决于对额外变量的充分控制。在心理学实验中，额外变量很少能够被直接控制。首先，实验者通常没有办法限制它们；第二，通常有太多的额外变量；第三，许多是实验者所不知的额外变量。心理学中额外变量过多的一个主要原因是人与人之间各不相同。一升氧气和其他任何一升氧气是一样的：当压缩或加热时，反应完全一样。但是没有两个人，甚至是同卵双生子，在所有的方面都相似。而且对于同样的处理，反应也不会完全一样。这是个严重的问题。从表面判断，在心理学研究的大多数领域似乎会排除实验控制的可能性。即使知晓了一个人的行为与他人不同的所有因素，实验者又如何能使除一个因素（自变量）以外的所有因素保持恒定？令人惊讶的答案是，有一种简单的技术能令实验者同时严格控制所有的额外变量，这是由英国统计学家罗纳德·费希尔于1926年提出的，叫做随机化的技术。让我用一个假设的例子来解释它的作用。

假设研究者希望调查哪种教学方法对儿童学习外语更有效：主要是依靠口语训练，还是基于写作训练。假设已有一些合适的测验用以评估儿童的外语学习程度，那么研究者应该如何进行研究呢？直截了当的方法是找一组用口语训练法的孩子和一组用写作训练法的孩子，给两组实施测验，比较平均成绩。这种简单的、直接的非实验研究的麻烦在于，结果会很难或者根本无法解释，因为没有控制额外变量。如果一组的平均分高于另一组，差异可能是不同教学方法的后果，但同样可以归因于一个或多个未加控制的额外变量。例如，无法保证两组孩子拥有相同的智力。如果智力不同，也可以解释结果的差异。

当然，控制智力因素相当简单。通过选择使两组孩子在初始智商得分上相匹配，调查者可以使智力因素保持恒定。如果一组孩子在外语测验上得分依旧较高，那么研究者就有可能将这种差异归因于不同的教学方法。但是，一旦当我们意识到还有许多数不清的额外变量需要考虑时，这种推论就有问题了。这比研究物理学中的气体定律要复杂得多，研究气体定律一次只需要考虑一个额外变量。也许一组中包含很大比例的孩子，他们的父母说外语；或者一组孩子的平均年龄高于另一组。不得不面对的令人沮丧的事实是，可能潜在影响孩子们外语测验表现的额外变量是无限的。通过匹配组设计，有些可以得到控制；但是另一些可能很难甚至不可能控制与测量。更令人担忧的是，调查者有时甚至没有想到一些重要的额外变量。也就是说，如果调查者采用我们所讨论过的准实验设计，结果就是不明确的。

随机化技术克服了这些困难，步骤如下。实验者从研究结果适用的总体中选取有代表性的孩子，将他们严格地随机（例如，用抛硬币的方法）分配至两个处理条件下。然后，两组孩子在其他方面完全一样对待。除了在自变量的操纵上产生差异，一组用口语训练法教学，一组用写作训练法。最后对两组孩子实施外语测验，比较平均得分。

简直是不可思议，随机化一次同时控制了孩子们之间的智力差异、父母的外语知识、孩子们的年龄以及其他所有额外变量，包括研究者没有考虑到的因素——例如，每组中男孩与女孩的比例基本一致。事实上，随机化保证两组在所有方面基本相似。而且组的容量越大，相似程度越高。如果你不相信，就按下面的示范试一下。从电话号码簿中任选一页，通过抛硬币的方法把所有条目分成两组。现在可以算出每一组中，名字中包含字母r的人数比例；或电话号码以7结尾的比例；或地址在城市某一特定区域的比例；或者其他任何你能想到的客观属性方面的比例。你将发现，两组基本是相似的，而且组越大就越相似。

理解随机化能做到什么与不能做到什么非常重要。随机化不能保证两组在所有方面完全一致，两组只不过趋于基本相似。而且至关重要的是，任何不一致都遵循机遇律（law of chance）。例如，当孩子们被随机分配到两组时，可能大部分是女孩，或者大部分孩子智商很高，又或者大部分孩子的父母说外语，偶然地全分到一组。但是由于机遇的作用，这是不可能发生的，特别当组容量很大时。并且这种可能性可以精确地计算出来。假定实验控制彻底，如果发现两组在语言测验上有差异，那么只有两种可能性：差异应当归因于自变量（不同的教学方法）或是偶然因素。

这正是统计进入心理学的原因。统计检验的意图是使研究者能够计算出由偶然产生差异的可能性的大小。如果可能性很小，那么研究者可以有信心地说差异是由自变量引起的，因为如果实验控制彻底，这是唯一的解释。