一项动态过程测试：贝叶斯更新

2026年07月27日

版权

一项动态过程测试：贝叶斯更新

对其他观点的轻视证明了一个不断反复出现的主题：当我们求助于过程测试以探讨预测者面对新证据时改变自己想法的意愿。贝叶斯定理再次设定了绝对的标准。一旦我们了解在一项预测练习中发生了什么，该定理就能够告诉我们，对于那些引发准确或错误预测的假定，我们应该持有多少信心。那个最终的信心比率（即后验几率比）应当这样运算：我们在假设我们或其他人观点正确的基础上建立的对观察到结果的似然性过去所拥有的信念（即似然比），乘以我们最初对事件发生动机做出的冲突假设的信心（即先验几率比）：

后验几率=似然比×先验几率

在早期实验室对信念更新的研究中，这一基本框架的应用是简单易行的。研究者会告诉参与者在一个袋子里有未知比例的红蓝两色扑克牌（即先验几率为50/50），然后随机从中抽取10张，其中x张为红牌，y张为蓝牌。研究人员会将改变对袋中扑克牌颜色比例想法的人数，与根据贝叶斯定理应该会改变想法的人数做一个对比（即后验几率）。[3]

可是，当我们测量专家们对诸如市场衰竭和大屠杀等逐渐演变的现实事件的反应时，我们的实验丧失了之前的准确性。合理与不合理、可辩护与不可辩护之间的分界线变得愈发模糊，以至于给我们以前的信念留有余地，可以根据我们的偏见评估对错：这样的余地在判断扑克牌颜色时几乎没有，但在判断政治自由或经济自由的趋向时却大量存在。然而这正说明，研究人们对现实事件的判断远非一个无关紧要的工作。这类研究足以说明让专家们承认自己犯了错有多么困难。在地区性的预测性研究中，通过使预测者事前对可能结果的证据力分值的承诺，减少他们摇摆的余地，以此观察我们能发现多少。输入预测者们对以下问题的回答，我们需要计算——作为一个粗略一阶估计——他们是不是及时的信念更新者：(https://www.daowen.com)

1.在你对当时起作用的根本力量（underlying force）理解正确的情况下，你估计每种可能的未来有多少可能？在信念更新方程中，我们将这些变量命名为P（x1|你的假设）、P（x2|你的假设）……其中x1、x2……是指可能的未来，你的假设是指“你对当时起作用的根本力量的观点”。

2.你对自己理解当时起作用的根本力量有多大的信心？我们指定这个变量为P（你的假设）。

3.在关于根本力量的视角中，思考与你不同的，选出其中对你最具说服力的，你认为这一视角正确的可能性有多大？我们将这个变量命名为P（对手的假设）。

4.如果其他的视角是正确的，那么你认为每一种可能的未来分别会有多大的可能性？我们将这些变量命名为P（x1|对手的假设）、P（x2|对手的假设）……我们在七个预测性地区中应用这一格式，包括苏联（1988年）、南非（1988年）、1991年的海湾战争、加拿大（1992年）、哈萨克斯坦（1992年）、1992年美国总统选举和欧洲货币联盟（1992年），同时还有一个不同的格式应用于其他几个地区，包括欧洲货币联盟（1998年）、日本（1992年）和印度（1992年）。[4]

这些练习即“声誉投注”：它们要求专家们像给不同的可能性分配赌注一样，对那些建立在对现实的不同观点基础上的预测进行确切的指定。在我们了解了发生了什么以后，我们便可计算出后验概率，即对这一问题“正确”贝叶斯式的回答是“多少专家会增加或降低他们对自己以前世界观的信心”。我们也可以再次与专家们联系并抛出大问题：考虑到你之前的声誉投注情况以及后续事件的发展走向，在你理解起作用的力量时，你愿意在你的信心方面改变多少？我们将会把专家们作为一个整体，或是诸如刺猬式和狐狸式这样分开的小团体，看看与贝叶斯式优良判断的标准相比他们有多好。