质的估计

质的估计

典型特征的作用

卡尼曼和特沃斯基是两位在自然推理和决策研究方面著名的心理学家。在一个实验研究(Kahneman&Tversky,1973)中,他们把被试分成两组,并告诉第一组被试:从100个人(其中70人是工程师,30人是律师)中随机抽出1个人;同时告诉第二组被试:从100个人(其中30人是工程师,70人是律师)中随机抽出1个人。接着,要求两组被试判断,这个被抽出的人是工程师的可能性。对于这个问题,两组被试都能正确回答。第一组答70%,第二组答30%。接下来又告诉两组被试:从100个人中又随机抽出1个人来,对这个人的情况还有下面这样一段描述:

杰克,45岁,已婚,有四个孩子。他总是很深沉,很仔细,而且雄心勃勃。他对政治和社会问题不感兴趣,而是把大量空闲时间花在他的许多爱好上,比如在家干木匠活、驾驶帆船、解数学难题,等等。

最后问这两组被试,这个人是工程师可能性有多大。结果,这一次两个组的被试都认为这个人是工程师的可能性比较大(两组均超过90%)。这是为什么呢?可能是这段描述很符合工程师的典型特征。但是,他们(尤其是第二组被试)忽视了这样一个前提:工程师在100人中分别占70%和30%。可见在判断人属于哪一类人时,人们往往忽视这一类人在人口中占的比率——基础比率(base rate),而只考虑对人的描述是否符合这一类人的典型特征(representativeness),或者说,是否符合对这一类人的刻板印象,这就容易得出错误的结论。

在基础比率特别低的情况下,忽视基础比率会产生比较大的判断失误。请看下面这个问题:

假设有位陌生人告诉你:有一个人很矮,很瘦,喜欢吟诗。然后要你猜一猜这个人是某大学古典文学教授还是一位卡车司机,你会如何回答?

很多人会说是教授,但是这个结论几乎肯定是错的。因为在全人口中,卡车司机的比例比教授大得多,何况还限定了是某大学的古典文学教授。即便卡车司机具备陌生人所描述特征的可能性很小,但是这样的人的总数也比符合这些特征的教授多一些,所以应该认为这个人更可能是司机而不是教授。

卡尼曼和特沃斯基(Kahneman&Tversky,1973)的实验进一步说明了根据典型特征进行的预测以及与这种预测相关的错误。实验中,对第一组被试(基础比率组,69人)提出以下问题:“考虑一下当今美国的所有一年级研究生,猜一猜这些学生从事以下9个专业领域的百分比。”9个领域见表9-6。表的第二列是各个领域基础比率的平均估计值。

表9-6 有关汤姆在9个领域的基础比率的估计值、相似度、可能性预测数据

图示

(来源:Kahneman&Tversky,1973)

向第二组被试(相似度组,65人)呈现以下性格描述:

汤姆,尽管缺乏真正的创造性,但智商很高。他喜欢秩序和明确,喜欢一切细节都井然有序而清楚整齐的东西。他写出来的东西相当呆板、机械,时而带出一些略带粗野的双关语和科幻小说般的想象。他对自己的能力要求很高,他对别人似乎很少表现出关心和同情,也不喜欢与人交往。他自我中心,但又很有道德感。

接着要求被试回答一个问题:汤姆在多大程度上像上述9个领域的典型的研究生?被试根据9个领域分别确定相似的等级。表9-6的第三列就是被试给出的汤姆在各个领域的相似度(数字越小表示越相似)。

最后,向第三组(预测组,114人)来自美国3所大学心理学专业的研究生被试描述汤姆的性格,另外还提供以下信息:

以上对汤姆的性格描述是一个心理学家在汤姆读高中二年级的时候写下的。该心理学家根据的是投射测验的结果。汤姆现在已经是研究生了。请判断一下他从事上述9个专业领域研究的可能性。

表9-6的第四列是预测组被试对汤姆从事9个专业的可能性的排序的平均等级。

对表9-6各列数据计算其积差相关系数。结果发现,可能性和相似度的相关系数是0.97,而可能性和基础比率的相关是-0.65(计算时要将大的等级数转换为小的,因为等级数越大意味着可能性越小)。显然,可能性判断基本上与相似度判断相一致而与基础比率大相径庭。这一结果直接支持这样一个假设:人们根据典型性或相似度来进行预测,而不太考虑基础比率。

有意思的是,第三组(预测组)的被试都是心理学专业的研究生,他们对可能性的预测违反了正规的预测规则。超过95%的人认为汤姆比较像是学计算机科学而不像是学人文和教育科学的,尽管他们肯定知道研究人文和教育科学的人比研究计算机的人多许多。根据表9-6中基础比率的估计值,研究人文和教育科学的人数和研究计算机科学的人数之先验比率大约是3比1(而实际的比率还要高许多)。由于对性格描述异乎寻常的依赖,预测组的被试显然没有考虑到以下问题。第一,既然投射测验的效度如此声名狼藉,那么汤姆实际上就很有可能不像描述中说的那样是一个强迫而又冷漠的人。第二,即使这样的描述是符合事实的,但那也只是他高中时候的事,而现在汤姆已经是研究生了,这种描述也许不再符合实际了。最后,就算这一描述至今仍然符合实际,但是在人文和教育科学界符合这样描述的人也许更多,原因很简单:研究人文和教育的人远远多于研究计算机的人。

合取谬误(conjunction fallacy)可能也是典型特征的作用的一种表现形式。合取谬误是20世纪80年代由特沃斯基和卡尼曼(Tversky&Kahneman,1983)提出的一种概率判断偏差,它指的是,如果个体对合取事件(事件的积,或A∩B)的概率判断值超过其对构成合取事件的两个事件(A、B)单独出现的概率判断值,他就犯了合取谬误。这是因为,根据概率论关于事件之积的概率的计算公式犘(A∩B)=犘(A)×犘(B),犘(A∩B)是不可能大于犘(A)或犘(B)的。但是,当参试者面对这样一份关于一位虚拟女性人物的描述文字时,其随后的反应常常违反这一公式。

琳达今年31岁,她单身,说话直言不讳,非常聪明。她在大学时读的是哲学专业。她还是一名学生的时候,就特别关注性别歧视和社会正义问题,并且参加了反核示威活动。请问:以下两种说法各有多大的可能性(对于每种说法,给出0~100之间的百分比例作为概率):

Ⅰ.琳达是一名银行出纳员,并且是一位女权主义者。

Ⅱ.琳达是一名银行出纳员。

结果是,参试者对说法Ⅰ给出的概率显著高于说法Ⅱ。显然,对于琳达的描述十分契合“女权主义者”的典型特征,从而犯了合取谬误。

信息可及性(https://www.daowen.com)

特沃斯基和卡尼曼(Tversky&Kahneman,1973)还发现,人类推理受到记忆中的信息的易提取性程度——信息可及性(availability)的影响。容易想起来的事情也比较容易被当作是经常发生的事情。

比如说,游泳危险还是登山危险?很多人会回答:登山危险。这是情有可原的,因为登山运动员一出事,全世界的广播、电视、报纸等媒体都会纷纷加以报道,使人产生很深的印象,以后提到登山运动时就很容易想到这些事故,从而认为登山容易出危险。而游泳虽然经常会发生危险,但是很少报道,印象并不深,所以反而觉得不怎么危险了。其实根据专家的研究,游泳比登山危险得多。

表9-7就是普通人和专家对各种事物危险性的评价。其中有一致的地方,也有很不一致的地方。这就是信息可及性不同造成的。表中数字表示危险性大小的排列次序(数字越小表示越危险)。

表9-7 普通人和专家对不同事物的危险性的评价

图示

框定效应

问题的形式也会影响推理过程。两个问题如果内容完全等值而采取不同的表达形式,有时也会得出截然相反的结果来。请看下面的问题。

假定美国正在准备对付一种疾病的爆发流行,估计这次流行会造成600人死亡,现在有两种方案,其估计效果是:

如果用方案一,200人得救。

如果用方案二,600人得救的可能性是1/3,全部死亡的可能性是2/3。

问被试准备采取哪个方案。结果75%的人选择了方案一。

如果采用另一问法:

如果用方案一,400人将会死亡。

如果用方案二,无人死亡的可能性是1/3,全部死亡的可能性是2/3。

这一次,当问被试准备采取哪个方案时,约有75%的人选择了方案二。这个实验说明,问题的提法(形式)对推理也会产生重大影响。

特沃斯基和卡尼曼(Tversky&Kahneman,1981)对上述结果提出了这样一个术语:框定效应(framing effects)作为解释。他们认为,人们评价结果的时候,往往有一个参照点(reference point),根据这个参照点来将结果分为“得”与“失”。一般来说,人们对“失”比对“得”更加在意一些。就上面这个例子而言,问题的第一种提法中的方案一强调200人能得救,其参照点为“没有人得救”,这是一种“得”,因此容易得到肯定;而与之等价的第二种提法中的方案一强调的“400人将会死亡”,容易被看作是一种“失”而受到否定。

关系错觉

人们在推理中另外一个常犯的错误是“关系错觉”(illusory correlation)——人们往往发现那些自己愿意发现的关系。例如,查普曼和查普曼(Chapman&Chapman,1967,1969)的研究发现,“画人测验”中关于患者症状与患者画出来的人的特征之间关系的描述是一种错觉。

画人测验是一种临床心理诊断测验。测验要求患者画一个人,然后主试根据一系列维度来给患者打分并作出评价。这些维度包括:人物肌肉是否发达?眼睛是否怪异?是否孩子气?是否肥胖?等等。临床心理学家“发现”,某些特征与患者特定的症状和行为特征有高度相关。例如,画出怪异的眼睛的患者往往比较多疑,而把头画得很大的患者则比较聪明。但是,这些“发现”一直没有得到专门研究画人测验的学者的证实。

为了探讨这个问题,查普曼和查普曼给一些大学生被试(他们不熟悉画人测验)看由患者画的45幅人像,这些人像与患者主诉的症状随机配对。这样,人像特征和症状之间应该没有什么关联。但是,这些大学生被试还是“发现”了临床心理学家“发现”的那些相关关系。看来,是先入为主的偏见造成了这种关系错觉。

忽略偏差和沉没成本效应

里托夫和巴伦(Ritov&Baron,1990)对被试提出这样一个问题:

假定你是一个孩子的家长。如果现在有一种儿童传染病在迅速传播,有一种疫苗可以预防。尽管这种疫苗有一定的副作用,但是相对而言,拒绝疫苗造成的损失更大(死亡率为10/10 000)。问:副作用造成的死亡率达到多少,你才会选择接受还是拒绝给孩子接种该疫苗?

结果表明,被试可以容忍的副作用死亡率平均为5/10 000。如果再高(尽管仍低于10/10 000),他们就会选择拒绝,即“不作为”。这就是忽略偏差(omission bias)——人们往往更多地容忍不作为的风险,而不愿意冒作为的风险。有些被试也坦陈,如果因为接受接种而导致孩子死亡,他们会感到责任大于不接种导致的死亡。当然,也不是每个人都会表现出忽略偏差。巴伦和里托夫(Baron&Ritov,2004)还发现,有58%的人表现出不作为,另有22%的人的表现正好相反,他们是“作为偏差”(action bias)。

沉没成本指的是已经投入无法回收的成本。例如,为某个工程投入了大量资金和人力,此时工程如果下马,已经支付的大笔费用无法回收。因此,很多情况下,只好将一些错误的决策将错就错地执行下去。这种效应就称为沉没成本效应(sunk-cost effect)。道斯(Dawes,1998)曾讨论了这样一个研究。研究中告知被试,有两个人周末花了100美元(不可退票)去度假。两人途中略感不适,并且觉得此时回家会更好些。他们会继续前去还是回家?许多被试回答说,他们会继续前去,以免损失那笔钱。这些被试觉得难以向自己和他人解释为什么会白白损失100美元。有人曾调侃说,人类确实比动物聪明,不过动物用不着向别人解释自己为什么这样作决定。