信念体系辩护

2026年07月27日

版权

信念体系辩护

预测者们为否认声誉投注结果而进行了各式各样创造性的辩护，我们将所有的辩护简化为七种“信念体系辩护”类型：质疑假设检验的逻辑条件是否满足、外源性震荡辩护、几乎成功的反事实辩护、“适时脱离”辩护、“政治如云般绝望”辩护、“我犯了一个正确的错误”辩护（并且将会再次这样做），以及从形而上学的角度提出意外总会发生。

我们运用定性和定量两种研究方法，以探讨那些回答错误的预测者们为何依然满怀信心地认为他们是正确的。我们首先运用定性研究来解释预测者们如何诠释投注结果，以及为何他们认为屡次不改变自己的想法是合情合理的。听取预测者们的辩护提醒了我们不能把这些反抗当作自我防卫式的牢骚而全部勾销的原因所在。判定现实世界中的人是不是优秀的贝叶斯学者被证明不仅仅是一个数学问题。“信念体系辩护”可能常常作为重新界定似然比所做的辩护性努力，这些似然比决定了“多大程度的信念改变才是合理的”（这一点会在第6章再讨论）。

随后我们运用了定量方法，该方法提醒我们不论预测者的辩护听起来有多合理，有力的统计证据表明在所有的辩论模式中都存在着自我服务偏见。专家们只有在犯了重大错误时才会从前面的七种辩护中援引辩护，而实际上，当他们“回答正确”的时候却从不这样做。在专家们援引辩护的频率和他们与贝叶斯理论的差距大小间也存在着有力的统计关联。

辩护的定性分析

质疑假设检验的逻辑条件是否满足　每个预测都是以专家对当时起作用的根本力量理解正确为前提条件的。一个人不必像一个逻辑学家那样去评估这一“条件限制”的复杂性。在对情况进行评估时，专家们可以自由选择他们所犯自我威胁最小的错误，以此承担过失之责。来看三个例子：

1.一个杰出的政治科学家小组在2000年8月宣布，他们的总统选举模型预示了即将到来的布什—戈尔竞选结果。他们有大概85%到97%的把握认定戈尔会赢得选举，而且是以至少52%甚至可能多达60%的选票优势大胜布什。[10]因此不必关注竞选中那些无关紧要的活动，或投票中出现的暂时的波动，执政党是不会输的：经济实力很强、国家秩序很稳定、总统的支持度很高。当然，结果是这些模型建立者弄错了。选举过后，我们发现越是那些赞同这一模型的预测者，越会争辩说这一工作的基本前提仍是正确的：模型只是被错误的宏观经济数据所误导。纳斯达克的崩溃、2000年个人财富的净亏损，都已经揭示了20世纪90年代后期迅猛的增长率开始下降了。人们已经感受到了痛苦。

2.1990—1991年的海湾冲突也是一个例证，它说明了专家们如何将他们的错误归于“理论上微不足道”的对先前事态了解的不足从而挽救核心假定。曾经预期萨达姆会“理性行事”并用撤离科威特的方式粉碎美国同盟的观察家们多次坚称他们是对的：萨达姆的确是在理性行事。但是理性的回应方式会根据局势的变化而变化，抢先撤离对于伊拉克来说已经不再是一个可以保全面子的选项，因为美国已经封锁了后路。作为初始预测出发点的地缘政治学意义上的理性促使他们做出最初的预测，但被国内政治意义上的理性所取代。当然，就像第2章的“猜数字”博弈一样，从何处终止这一博弈论推理的无限回归并不明晰。为什么猜测萨达姆可能已经放弃了打破美国封锁保全面子的撤退的努力？当我们不知道该如何划定有限理性的界限时，不确定性就产生了。

3.更普遍的是，在政治辩论中常会听到一方抱怨被愚蠢的预测所困扰。“错误”的一方坚持他们在外交影响的基本策略及宏观经济政策的基本手段上并没有弄错，他们“仅仅是”没有预料到政策被执行的多么拙劣。如此，专家们在20世纪90年代各自坚持着不同的观点，比如“如果北约组织给塞尔维亚人发出正确组合的信号，我们本可以避免这场新的流血”或者“如果叶利钦实行了真正的‘休克疗法’，那么俄罗斯本可以避免新一轮的通货膨胀”。这种信念体系辩护将条件性预测（如果满足条件x则y将会发生）转变为历史性反事实（如果当初能满足条件x那么y本来是可以发生的）。反事实历史成为埋葬令人尴尬的条件性预测的便捷之墓。

外源性震荡辩护　所有的假设检验都以“ceteris paribus”或者“其他所有因素均相同”这一条件为前提。原则上，预测者总是可以这样为自己争辩：尽管实现预测的条件都已满足——他们对根本力量理解正确的前提下——但是核心的背景条件呈现出不可预测的、异乎寻常的情况使原本可靠的其他决定性因果关系出现了短路。

理论家们也发现了这一辩护的便利，这允许他们在解释预料之外的事件时归因于外在于他们的理论逻辑范畴的力量。一个现实主义学者，震惊于戈尔巴乔夫在军备控制问题上所做出的巨大让步，评论道：“我研究国家间关系。我不是什么苏联政治专家。假设一个婚姻理论预测说一对夫妇会继续维持不幸福的婚姻，结果这对夫妇咬牙坚持了数十年，然后那名丈夫突然死于致命的心脏病发作。这便能说明这个理论失败了吗？当然不能，失败在于预测者没能与心脏病医生建立联系。那么，我的失败实际上是在于没有意识到苏联的病情有多严重。”

同理，一部分总统选举模型的建立者将戈尔的失败归因于“突发”变量。克林顿试图掩盖与莫妮卡·莱温斯基（Monica Lewinsky）之间的性丑闻的行为，以及随后的弹劾使得相当一部分民众变得更加关注道德而不是国家的经济健康。在简约的选举模型中没有考虑行为混乱的总统及其伪证陷阱。

外源性震荡辩护的范围可以从荒谬（例如，一个白宫实习生向难以控制生理需求的总统展露她的内裤）到崇高（例如一个异常成熟的政治犯迅速在他所在国家的第一次跨种族选举中成为总统）到悲剧（例如，一个处于严重分裂状态下的国家总理在试图与宿敌和解时被暗杀）。而且，外源性震荡不仅能够测量微观，也可以测量宏观：苏联经济的崩溃或者东亚、墨西哥和华尔街的金融恐慌，或者干旱、地震以及其他自然灾害。实际上，任何超出专家的理论框架之外的事情都可归于外源性震荡。当然，一旦被“震荡”，专家们可以做出选择，继续将这一震荡排除在模型之外（将它归类为不可简化的误差方差）或者将它包含进去（会把他们的模型“搞得一团糟”但也会提升这些模型未来的吸收能力）。

几乎成功的反事实辩护（“我几乎是对的”）　该策略走到了外源性震荡辩护本质的极端，明确主张尽管预测的结果没有发生，它也几乎发生了，若不是因为一些细微的和可想而知的干扰性的意外，它本该发生。这种“几乎成功的反事实辩护”在数个预测情景中神出鬼没。

1.一些苏联的观察家，在1988年时就认为苏联共产党不会在1993或1998年之前倒台，尤其相信苏联政府的强硬派在1991年的政变未遂中几乎推翻了戈尔巴乔夫，如果谋反者能更加坚决和清醒，如果核心军事人员能够服从格杀反对戒严令平民的命令，或者如果叶利钦没有表现得那么勇敢，他们本会成功的。

2.预测欧洲货币联盟会崩溃的专家们争辩说，这一预测在1992年的货币危机期间几乎应验，若不是那些忠于欧元的政客们的原则性坚持（甚至顽固）以及中央银行家出于同情的干涉，崩溃本会发生。考虑到具有“坚实经济基础”的国家和“不得不通过在账目上耍花招来缩减预算赤字”的国家之间持久的利益冲突，考虑到针对单一欧洲货币的“激烈的民族仇恨”，这些专家认为在1997年大部分欧洲领导人仍然支持货币联盟是个“小奇迹”，尽管计划漏洞百出。

3.预测老布什会在1992年再次当选总统的美国局势观察家们发现，想象克林顿从来不会成为总统，比预见到克林顿会获胜要来得容易。他们只需选定一个更顺从的联邦储备委员会（在1991年早些时候下调利率，“正如在经济衰退时期总会采取这一措施一样”）以及一项旨在为克林顿的人格做负面广告宣传的巧妙运作（“摘下面具露出无耻之徒的真面目吧——别在选举活动里装绅士”）。

4.预测魁北克会脱离加拿大的专家们注意到，第二次独立公投的结果距离通过有多么接近（“在抽样误差的范围内，如果再有一小部分比率的选民投了赞成票，联邦就会解散”）以及在运动中如何更加巧妙运作会使结果改变［“如果一个更机智的领袖，比如布萨（Lucien Bouchard）而不是帕里佐（Jacques Parizeau），能够引领这项运动，那么魁北克已经成为一个独立的国家”］。

5.预测萨达姆·侯赛因会在权力平衡向不利于他的方向倾斜时撤出科威特的专家们经常声称，如果萨达姆如他们那般清晰地了解形势，他便会如他们所预期的那样行动。这些专家们还试图把结局的悲惨归于萨达姆的病态人格角度，认为他远比其他国家的领导人行事鲁莽。一个专家抱怨道：“谁知道是什么因素导致他如此？也许他认为宁愿做一天公鸡也不愿意当一辈子小鸡。但是，从有关他的记载判断，他可能深悟另一句格言，并相信它更适合自己（像萨拉丁[11]）——撤退以待来日再战。”从这种观点出发，我们只是萨达姆大脑中偏离了避免战争想法的一个突触联结。(https://www.daowen.com)

6.预测南非将在1989至1994年由少数白人继续统治的观察家们尤其倾向于相信，如果不是两个担任领导角色的关键人物——德克勒克和曼德拉——巧合性地联合，南非将很容易滑向镇压、对立和暴力不断升级的道路。

7.将哈萨克斯坦视作“一些南斯拉夫人静待爆发种族暴力冲突”的观察家们将该预测的落空归为哈萨克族领导人的精明，以及时任的俄罗斯领导群体无意打“种族牌”，而这些都是可以轻易改变的，只要“叶利钦的心脏最终停止”和在政治上迅速支持居住在哈萨克的俄罗斯人的活动。

8.被围攻的总统选举模型建立者也提出了几乎成功的辩护。乍一看，要进行这一辩护似乎很容易。受蝶形选票、吊挂式选票（hanging chads）以及司法幻想的影响，此次选举将被视为历史上意外最多的一次。但是那些预计戈尔会取得决定性甚至压倒性胜利的宏观模型建立者不会就此轻易脱身，为了解释他们的预测与实际情况相差的几百万张选票，他们需要诉诸充分有力的理由。为此，他们提出了种种几乎成功的情况假设，包括“如果纳德[12]没那么有吸引力或没有如此自恋和强硬……”，“如果戈尔不是一个如此糟糕的辩论者……”，“如果选举推迟几天，趋势走向就会……”，以及“如果克林顿没有如此无可救药地自我放纵……”。

“适时脱离”辩护　这个策略让我们从反事实世界回到了现实世界。专家们经常强调，尽管预测的结果尚未发生，我们只需要耐心等待：它最终总会发生。当然，这种辩护的运用是有限的，只用于结果尚未不可逆转性地排除的政治博弈中。没有人到了2001年还预期阿尔·戈尔取代乔治·W·布什在白宫的位置，有些事情已成定局。但是专家们确实经常争辩说他们所认为会发生的趋势只是被延迟了，加拿大将来仍会分裂（魁北克人党会在第三次独立尝试中获胜），哈萨克斯坦最终会陷入南斯拉夫式的跨种族战火之中（煽动者会抓住哈萨克斯坦出现的种族动员机会），欧洲货币联盟创造统一货币是枉费心机，总有一天会在挫折和讽刺中结束（成员国之间的利益分歧会引发危机，即便有坚定的领导也无法解决），核战争最终会导致南亚或者朝鲜半岛的悲剧命运。实际上，这些专家们承认在我武断的时间框架里他们或许是错的，但随着时间的推移他们的预测最终会被证实。

“政治如云般绝望”辩护　专家们还选择了一种哲学上的辩护，他们争论说，即便所有的预测前提条件都符合，而预测的结果从未有发生的迹象并且将来也不会发生，这也不应被当作预测者的失败。预测练习最好是被当作一种无关紧要的轻松消遣，因为每个人都知道，或者应该知道，政治固有的不确定性，并非像钟表那样精确，而是更像云一般难以捉摸。[13]正如苏联解体后，亨利·基辛格（Henry Kissinger）在给丹尼尔·莫伊尼汉（Daniel Moynihan）的信中戏谑写道：“你的水晶球比我的好用。”[14]这是一个什么都没有退让的退让。

我们需要警惕这种辩护的变型，即那些认定为错误的预言者们所辩称的“随机环境”（那些答对了的人只不过是“幸运”）的危险性以及草率拒绝正确的观点（那些答错了的人只不过是运气不佳）的危害性。一些在我们的练习刚开始时认为自己能够对未来进行很多预测的预测者们无疑很确信，与扔飞镖的黑猩猩相比，他们提供的预测更多，而他们在练习结束时听起来却像是激进的怀疑论者——这一转变简直让人怀疑，第2章所提到的激进怀疑论者其中的一部分，是否就是这些尚未从现实的打击中恢复过来的曾经大胆的预测者。

“我犯了一个正确的错误”辩护　第六种策略承认自己的失误，但不是努力将预测与现实之间的差距降到最小，而是将这种失误描述为追求正确政治优先过程中的天生的副作用。正如一个保守主义者所公然宣称的：“对苏联共产党持久力的高估是一件明智的事，无疑比低估更明智。”一些自由主义者也用这种辩护模式的翻版为20世纪90年代世界货币基金组织向俄罗斯贷款一事辩护。大量资金或许已经被误转至瑞士银行的账户上，但是考虑到一个核超级大国金融可能崩溃的危险，转述世界货币基金组织二号决策者斯坦利·费希尔（Stanley Fischer）的话说，发行贷款是“周到之举”[15]。

专家们在很多政治议题上都求助于“我犯了一个正确的错误”辩护模式，包括核扩散、种族清洗和金融传染。而且，围绕这些例子的是一个共同的主题。在每个案例中，专家们都把持着评价体系，从而使他们能够把自己声称事情会变糟的“虚报”描述成为不如“预测遗漏”那么严重的错误。就像一个专家有点烦躁地回应道：“狼来了是以保持警惕为代价。”在2001年9月恐怖分子袭击纽约和华盛顿、哥伦比亚特区的事件余波之中，这位专家补充道：“美国现在理解了看似不可能的威胁也可能突然发生，如果你想要安全，你最好是妄想狂。”

低概率结果恰好发生的辩护　如果我们认可那些顽固的心灵坚持他们最初做出的低似然性估计的x没有错，如果我们需要与生活于低似然性世界达成存在的妥协，那么我们上面所列举的信念体系辩护将是不完整的。这种辩护与其他几种如外源性震荡和几乎成功的反事实辩护争论有很多重叠之处，即将观察到的结果描绘成凭借运气的。但有一个区别，某个专家可能会争论说我们最终居住在了一个低可能性的世界，不需要提供任何辩护（比如高似然性的世界几乎就实现了）或理由（某种不可知的力量使历史偏离了轨道）。决策者不断旋转着历史的轮盘，所以当银色的小球偶尔停在了为数极少的绿色区域而不是占轮盘90%以上的黑色或红色区域时，我们不该感到惊讶。

信念体系辩护的定量分析

现在我们停止聆听这些辩护，转而去计算它们。我们的目标是探究在不同情况下不同的群体会有多少次提出这些各不相同的辩护。我们观察得越仔细，将这些辩护从整体上作为信念体系辩护去进行特点描述的基础就越坚实，当专家们输掉他们曾经笃定的声誉投注，他们会以自我服务的方式充分运用这些辩护来为他们拒绝改变自己的想法辩护。

以下是基于多项证据的自我服务偏见在系统化论证中的案例。

1.可疑的选择性：哪些预测者会贬低先前声誉投注的提出的辩护。当意料之外的事情发生时，专家们会更倾向于支持这样的辩护。在60组比较实验中，有39组的t检验结果显示，刚刚输掉声誉投注（他们预测的最有可能的未来没有实现）的专家比刚刚赢得这些投注的专家更热心于支持辩护列表中的七种争辩（p＜0.05）。对比来看，与刚刚输掉声誉投注的专家相比，赢得投注的专家从未对“辩护性”认知表现出过多的热情。

2.错误程度与辩护启动之间的关联。从心理角度来看，这一点是显而易见的：专家对最初的预测越确信，被证明不成立所造成的威胁就越大，专家消除不利证据的动机就越强。其他所有条件相同的情况下，一个在1988年90%确信苏联强硬派会在1988年到1993年之间重掌政权的专家，相比于对同一预测的确信度只比“猜测”稍微多一点的专家，应该更会因为期间发生的事件感到不安。为检验这一预测，我们将六种经过测量的信念体系辩护加总创造出一个综合辩护指数，被预测的模式果然出现。在未作出准确预测的预测者中，对先前预测的信心程度与综合辩护指数总是正相关的，相关值在0.26至0.42之间变动，而在做出准确预测的预测者中，同一相关系数在0附近浮动，数值在-0.05和0.08之间。

3.对辩护的依赖程度和对以前观点的信心保有程度之间的关联。如果信念体系辩护缓解了预期意外事件带来的打击，那么预测的最有可能方案没有实现、但支持“辩护性”认知的专家们，应该在了解所发生事件之后对他们的最初预测保有更多的信心（事后对先前预测信心）。而在预测被证实因此信念体系核心原则不会受到任何威胁的专家们当中，这种相关不应该出现。正如预测所示，在未作出准确预测的预测者中，在所有领域里辩护指数与事后信心都是相关的（相关值在0.29和0.59之间）。与此相反，在做出准确预测的预测者中，辩护指数与事后信心之间几乎没有关联（相关值再次在0附近浮动，数值在-0.01和0.06之间）。

4.对辩护的依赖程度，信念更新的失败以及认知方式之间的关联。我们发现：（a）“失败者”越拒绝改变他们之前的观点，他们采取辩护的程度就越高（r=0.49）；（b）刺猬式失败者（比狐狸式失败者更容易拒绝改变自己的想法）采取辩护的程度大体上为狐狸式失败者的两倍；（c）按贝叶斯定理规定的与失败的专家实际上进行的信念改变程度二者之间的差距越大，专家们采取辩护的程度就越高（r=0.31）；（d）当我们对不同专家支持信念体系辩护的频率进行变量控制时，成为刺猬与成为声誉投注中的糟糕失败者之间的关系消失。[16]

总而言之，信念体系辩护假设将多股证据联系在了一起。辩护性认知在预测者们最需要它们的时候被激活，而对辩护性认知的支持——总体来说——在较差的贝叶斯信念更新者身上体现更为明显。需要强调的是我们关注的焦点是心理学上的而非认识论上的，我们将对辩护的可辩护性的充分讨论推迟到第6章。[17]