逻辑一贯性测试

逻辑一贯性测试

如果我在“人人都是天生的贝叶斯派”的错觉下进行测试,那么这种错觉会在我检验人们是不是好信念更新者之前消除。贝叶斯理论的基础框架建立在逻辑的同一性之上,并且我们能够判断出在孤立的时间点上一次捕捉到的信念体系是否满足这种同一性。假设一个观察家仅能区分出两种对世界可能性的解释:自己的以及对手的。我们可以推断出观察家得出的结果(x1)的可能性是基于以下两点认识的:(a)该观察家在多大程度上相信自己对现实的解读优于对手;(b)如果自己的解读相比于对手是正确的,那么观察家在多大程度上相信x1会成为最后结果:

P(x1)=P(x1|观察家的假设)P(观察家的假设)+P(x1|对手的假设)P(对手的假设)

在对10个地区的预测练习中,我们要求专家们通过给这个等式两边的各个变量赋值来进行预测(见方法论附录),几乎没有人能够逐渐领悟到,在x的似然性的基础上对任何事物的评估超出了,按照他们自己的世界观进行预测时对x条件似然性的评估。他们对上面两个问题的回答几乎可以互换(r=0.83),专家们似乎有百分之百的自信:自己是正确的而其他人都是错误的。因此,在对作用的力量解析中所给出的概率必须与x的概率画等号。

一种温和的观点将这种“错误”归结为语义混淆。可以理解的是,人们会认为,当我们向某个专家询问某个事件发生的似然性时,我们想要的正是他们自己的而非任何其他人的观点。但是当我们对该问题进一步追问时,问及某个结果的似然性之前,我们分别寻求两种独立的判断:即对手的视角是正确的似然性判断,以及如果对手视角是正确的对结果的似然性判断,但结果依然是一样的。在评估x的似然性时,专家们并不计算以对世界的多种解读为真(与之相伴的是专家对每种解读的信心的权重比例)为条件的x似然性的加权平均数。他们以一种内在的直觉寻求帮助,固守在他们自己的观点之上,作为一种存在的确定性。[1](https://www.daowen.com)

如果一个人对自己是正确的充满自信,仅考虑自己的世界观时,将不会有任何逻辑错误,那么同一性等式右边的第二部分数值将降至零。但是,大部分测试参与者——包括刺猬——对自己并没有那么确定。当预测者被问及其他观点可能正确的似然性时,他们给出了远大于零的估计(平均0.27)。当一个人相信其他视角也确实做出了同样的预测时,他只考虑自己的视角也不会产生任何错误。但是当预测者被问及以他人视角的正确为条件发生“最可能的未来”的似然性时,他们给出的似然值远远低于以他们自己的视角正确为条件的估计(平均差距0.46)。最终的结果——如技术附录中的图附—6所示——是“自我中心主义差距”:专家们赋予他们最可能发生的未来的概率总是高于——如果他们优秀的贝叶斯学者将其他视角纳入考虑——他们应该赋予未来的概率。

对其他视角的轻视在技术上是无害的。如果预测者能够成为更好的贝叶斯专家,他们的预测将得到更准确的校准。他们会将最具现实性的概率评估赋予他们最有可能的未来,从而使概率—现实的差距缩小26%,这样狐狸和刺猬都会受益,其中狐狸的评估差距缩小18%,刺猬的评估差距缩小32%(详见技术附录)。

这一结果模式是一个预警:专家们并不是天生的贝叶斯学者,真正的贝叶斯学者习惯于把经历看作一种机遇,以调整相互竞争的假设的对比值。一个更合理的模型是,我们是天生的自我中心主义者。在估算一种情况时,我们很难将其他视角纳入考虑,很少有人能自发地将其他观点作为我们进行估计的参考因素——即便我们只需稍作考虑便会发现,这些观点为正确的可能性绝非微不足道。[2]