数量预测

2026年07月27日

版权

数量预测

易计算性

事件概率计算的难易程度，是影响概率推断的一个重要因素。特沃斯基和卡尼曼（Tversky＆Kahneman，1973）通过实验证明，两个事件即使实际概率相同，但是如果其中一个事件的概率不易算出，则相对容易算出的那个事件而言，它的概率就往往被低估。实验中主试问被试，由10 个人组成一些小组，有几种组合方法。把被试分为两组，对第一组被试问：10个人组成2人小组有多少种组合方法？被试认为可以有70种组合。对第二组被试问：10个人组成8人小组有多少种组合方法？被试认为可以有20种组合。其实两种情况下都是45种组合。因为2个人编成小组后，其余8个人自然也形成了一个小组，所以用10个人组成2个人的小组和组成8个人的小组是等价的，但是不懂数学的被试一般看不到这一点。由于8人小组的组合数比较难以计算，所以第二组被试给出的组合数较少。

评价和预测

卡尼曼和特沃斯基（Kahneman＆Tversky，1973）在一个实验研究中设置了这么一个问题情境：

假定告诉你：咨询人员将一位大学一年级新生描述为“聪明、自信、好学、努力、好奇心强”。考虑可能提出的以下两类问题：

（1）评价：这样的描述使您对该生的学业能力产生了多强烈的印象？您认为还有多少百分比的大学新生会超过他？

（2）预测：您认为这个学生平均可以得到怎样的成绩？比他成绩好的人占多少百分比？

这两个问题之间存在重要的差异。第一个问题让你评价学生的现状，第二个问题让你预测他的将来。应该说，预测未来涉及的不确定性远远大于评价当前现状，因此预测给出的百分比应该比评价给出的更接近50%（一个随机猜测的概率）。进一步说，如果上面的个案描述不准确，会造成什么影响？其实，不准确的描述不会影响你的评价：评价是根据描述给你的印象为个案排序，与描述的准确性无关，但你对描述的怀疑程度将影响预测，否则你的预测将会是无效的。

但是，卡尼曼和特沃斯基的实验结果告诉我们，被试预测和评价的结果是一致的。在评价一个个案的时候，人们总是选择一个最能代表这个个案的分数。如果是根据对个案的描述进行预测，人们也会选择最有代表性的分数。这样，评价和预测将得出几乎相同的结果，而不是我们设想的，预测的结果相对而言会向50%接近，或者说，预测比评价更具有回归性（向50%回归）。

预测和变换

前面的研究告诉我们，对于变量的预测不比对同样变量的输入的评价更具有回归性。卡尼曼和特沃斯基（Kahneman＆Tversky，1973）的另一个实验则告诉我们，在有些情形下，对于变量的预测（学业成绩）甚至不比这个变量纯粹的数量变换更具有回归性。参加实验的有三组被试。各组的被试都要根据10个假想学生的某种百分等级分别预测其平均学习成绩。呈现给三组被试的百分等级都是一样的，但是各组得到的输入变量的名称和解释却不一样。

1.百分等级平均数。告诉第一组被试，他们将得到反映这些学生第一学年学习成绩的百分等级。被试的任务是尽可能地猜测那一年学生的平均学习成绩（分数）。对百分等级的解释是：“如果百分等级为65，就意味着该学生班级里有65%的学生的平均分数不如他，依此类推。”可见，这只是一个数量变换（根据百分等级估计实际分数）而已。

2.注意力。告诉第二组被试，他们将得到这些学生的注意力的百分等级，并且告诉他们：“研究发现，学习成绩好的学生，注意力测验的得分也比较高，反之亦然。但是，注意力测验的成绩往往受到被试在接受测试时的心理状态的影响。因此，如果重复测量，同一个人可能会得到完全不同的成绩。”也就是说，这组被试要根据注意力测验得分的百分等级来预测学业成绩。

3.幽默感。告诉第三组被试，他们将得到这些学生的幽默感测验的百分等级，并且告诉他们：“研究发现，幽默测验得分比较高的学生学习成绩基本上比那些幽默分数低的成绩好。但是，我们不可能根据幽默能力准确地预测学习成绩。”也就是说，这组被试要根据幽默感得分的百分等级来预测学业成绩。

根据这样的设计，所有的被试都要预测学生的成绩。第一组被试只要将学业百分等级变换为学业平均分数。第二组和第三组被试则要根据联系不那么紧密的因素来预测学业平均分数。理论分析告诉我们，后两组的预测应当更具回归性，也就是说，它们比第一组的判断的离散程度小。但是，实验结果显示，第二组的预测的回归性不超过第一组。第三组是最具回归性的，因为大家都知道幽默感不能当作学习成绩的指标。(https://www.daowen.com)

对每一个被试的数据都计算了预测的平均数、标准差、预测得分和输入得分之间回归线的斜率以及两个得分之间的积差相关系数。表9-8是三组被试上述指标的平均值，表中的ns表示没有显著差异。

从表9-8中显然可以看出，第一组和第二组、第二组和第三组之间的比较说明根据成绩的百分等级进行预测与根据注意力进行预测所得的结果没有显著差异。可见，人们在根据某种能力预测其成就的时候没能表现出回归性，尽管对这种能力的测量很不可靠。

表9-8　三组被试统计指标的平均值以及各组之间的比较

（来源：Kahneman＆Tversky，1973）

对于回归现象的判断

卡尼曼和特沃斯基（Kahneman＆Tversky，1973）还提出，人们自然推理中经常忽视回归现象，其中甚至包括学过回归分析的人。在我们的生活中，回归现象到处存在着：杰出的父亲往往免不了有个不太争气的儿子，优秀的女人往往嫁一个木讷的丈夫，一帆风顺的人最终往往一蹶不振。尽管有这么多例子，人们对回归还是缺乏适当的认识。

为什么回归这么难以觉察？卡尼曼和特沃斯基提出以下看法：人们总是认为，人的每一个重要的行为都高度体现了这个人的人格特征，也就是说，一切都有人格上的原因；而对随机误差，人们往往考虑得比较少。

为了说明尽管考虑到统计学原理，非回归直觉仍然难以克服这一事实，卡尼曼和特沃斯基对一些心理学专业的研究生提出如下问题：

有一个经随机抽样抽取的被试，标准化智力测验得分为140。假设IQ是真实分数与随机误差（正态分布）之和。请猜测这个人的真实IQ值，要求：给出一个上限，保证真实的IQ有95%的机会低于这个上限；再给出一个下限，保证真实的IQ有95%的机会高于这个下限。

在这个问题里面，要求被试将观测到的数据（智商）看作是“真实”分数和误差分数的结合。既然观测到的智商显著高于普通人，那么误差值就很有可能是一个正值，这个人在以后的测验中分数就很可能下降。但是，大多数被试（108人中有73人）得出的置信区间的中心点还是140，没有表现出任何回归。在剩下的35名被试中，24人的置信区间有回归趋势，11人却有提高的趋势。由此可见，大多数被试将140看作是一个真实的分数，并在此基础上进行预测。这种仿佛输入信息没有错误的预测倾向是经常发生的。

为了说明识别和正确解释回归效应的困难之处，卡尼曼和特沃斯基还用下面这个问题来考验研究生：

飞行学校的教官采用了心理学家推荐的持续正强化的方案。他们对学员的飞行动作的每一个成功进行口头强化。这个方法实行了一段时间以后，教官觉得，心理学家说的好像不对，对复杂动作奖励多了只会损害以后的成绩。对此，心理学家应该怎样回答？

其实，在飞行训练中，回归效应是不可避免的，因为成绩并不是一个完全可靠的指标，两个成功的动作之间产生的进步也是缓慢的。因此，飞行员前面一个动作做得非常好，后一个步骤就往往差一些，而无论教官对前面那个动作是否奖励。通常，我们总是奖励好的行为，惩罚不好的行为。而仅仅是由于回归效应，受到惩罚的人行为就很有可能出现改进，而受到奖励的则出现退步。结果，我们常常惩罚别人后得到奖励，而奖励别人后却受到惩罚。

但是，实验结果是没有一个研究生用回归效应来回答这个问题。相反，他们认为，言语强化对飞行员可能失效，也可能导致过度自信。有些学生甚至怀疑教官观察的效度，分析起他们知觉方面的偏差来。这些研究生毫无疑问都受过正规的统计学训练，应该懂得回归效应。但是，他们没有能够识别出这个回归，因为主试没有用他们熟悉的语言（即父亲和儿子的身高）来提出这个问题。显然，单单是统计学训练还不能改变人们对不确定性的直觉。