好判断的过程与一致性的概念间的联系

2026年07月27日

版权

好判断的过程与一致性的概念间的联系

让我们结束围绕相关证据的情况说明。第3章运用多种指标以表明，相比于刺猬，狐狸会在可能未来的预测中赋予更多的现实性的概率估计。最恰当的解释把狐狸和刺猬表现的差异归于不同的推理方式。狐狸具有预测准确的优点，但当我们控制住推理方式的影响时，优点消失了。狐狸的论证推理具有这样的倾向：报告的想法集内容上的自我批评和结构的辩证于一身，在为预测结果而提出的不同原因间转换，再转而对当前推理进行批评并提出预测相反结果的论证，最终转向自我反思式的努力，以求对互相冲突的考虑进行切实的结合。狐狸，用心理学术语来说，比刺猬更具有“整合复杂性”。[23]

第4章已经显示出，尽管按照贝叶斯的标准，狐狸距离理想的信念更新者还差得很远，但当意料之外的事件发生时（常常如此），他们更倾向于向着正确的方向适当程度地改变他们的想法。最恰当的解释把两者表现的差异归于两个因素：（a）刺猬过于依赖信念体系辩护，诸如几乎成功的反事实辩护和适时脱离辩护等，这些辩护给他们以心智上的掩饰，使其可以争辩说这些错误没什么大不了的，并拒绝放弃以前的立场；（b）刺猬更易受到事后之明偏见的影响，这一偏见使他们深信自己虚构的情景，认为他们最初的预测离正确的预测并不远。

在这两章中，刺猬表现不佳的根本原因都是他们不愿意考虑自己可能是错的，这一解释将一些附带的零散结论联系在了一起。整合复杂性指数作为自我批评推理方式的测量标准，在第3章中是预测好判断一致性的指标，也预测专家们拒绝改变概率估计的趋势，这体现在他们在回应预料之外事件时，在动员为以前预测进行辩护的信念体系辩护时，以及在回忆过去立场中表现出事后之明偏见时（r's=0.26、0.35和0.27）。同样，自我辩护作为刺猬式的推理方式，转化成为较差的预测表现又转化成为较差的信念更新表现。对相关矩阵的审视显示了更好的信念更新者有着更好的预测记录，特别是校准得分。这些相关也并非十分强——在0.25和0.36之间——但它们的显著性是持久的。当我们根据不可靠的程度来修正相关减弱的误差，以此将我们测量手段的误差正式带入公式时，证据会更加集中。

图4—3把这些新发现整合到了图3—5展示的好判断的概念框架中。一种狐狸式的、整合复杂性的推理方式对预测技巧的影响，如今被避免直面概率投注以及成为更好的信念更新者这两种趋势调和了。

图4—3

一个建立在图3—5基础上的概念架构，添加了我们在第4章获得的趋向性结论：具有整合复杂性的狐狸能成为较好的贝叶斯信念更新者。它指出具有整合复杂性的思考者享受预测技巧进步的乐趣，部分是因为他们面对意外之事更愿意改变想法，部分是因为他们更有可能牢记过去的错误（降低事后之明偏见）.部分是因为他们更有可能乐见预测相反结果的案例，从而进行更谨慎的概率判断。那些越快认识到过去错误的人越不易于在未来犯错。

但我们可曾在20世纪末听到过任何关于好判断的惊喜？现在我们遇到了社会科学家解释的困境：在被判断为明显或明显错误之间做出选择。聪明的狐狸式学者会把当前结果视为是出乎意料但仍可以接受的，是为他们一直坚持的观点的辩护。这些学者一再把心智失败的心理根源归于不愿意充分地进行自我批评，不愿意重新检查基础的假设，不愿意质疑教条，以及不愿意聚合想象力去大胆考虑那些可能会被他人嘲笑的选择。[24]政治观察家真的应该听从奥利弗·克伦威尔（Oliver Cromwell）（并非有意讽刺但的确令人不悦）在1650年给他的敌人们提出的建议：“我恳求你们，看在基督的份儿上，考虑一下你会犯错误的可能性。”[25]

刺猬式评论员则不会这么大度。他们会认为当前结果具有深深的迷惑性，原因在第6章得以阐明：政策和智识的失败多半归结为因过度的自我批评引发的麻痹和自我怀疑。引用迪安·艾奇逊（Dean Acheson）在古巴导弹危机期间对理查德·诺伊施塔特（Richard Neustadt）提出的告诫就是：“我明白您的理论，教授。您认为总统应该得到警告，但是您错了，他需要信心。”如过分自信和信念顽固这类所谓的偏见，最急需的是支持，并输入到政策中。

关于正确过程诊断的争论如同源于证据一样，源于性情。尽管如此，证据并非无关紧要。数据告诉我们，对于某事，一个阵营怀疑为真，另一阵营怀疑为假，但双方都没有进行过系统性的调查，因为他们都很确信自己立场的真相是极为明显的。这一事件的结果究竟是清晰明了还是明显有误，需要留给子孙后代去判断了。

[1]从对话准则（conversational norms）工作的角度，本研究采用的提问顺序——恰好在提出底线概率评估之前提出其他可选视角的问题——包含一种极其严格的测试的想法，即预测者有意忽略了其他可选的视角。近因经常在谈话中成为一种暗示，谈话者会将刚刚讨论过的信息视为相关的［H.P.Grice，“Logic and Conversation，”in Syntax and Semantics，vol.3.Speech Acts，ed.P.Cole and J.L.Morgan（New York：Academic Press，1975），41-58］。

[2]这一结果同多项实验研究相一致，包括：（a）关于虚假认知（pseudo-diagnosticity）的研究，它显示人们太过轻视似然比的共性。（b）关于自我中心偏见的研究，参见H.R.Arkes and M.Rothbart，“Memory，Retrieval，and Contingency Judgments，”Journal of Personality and Social Psychology 49（1985）：598-606；B.Fischhoff and R.Beyth-Marom，“Hypothesis Evaluation from a Bayesian Perspective，”Psychological Review 90（1983）：239-60；L.Ross and D.Griffn，“Subjective Construal，Social Inference，and Human Misunderstanding，”in Advances in Experimental Social Psychology，vol.24，ed.M.Zanna（New York：Academic Press，1991），319-59；R.E.Nisbett and L.Ross，Human Inference：Strategies and Shortcomings of Social Judgment（Englewood Cliffs，NJ：Prentice-Hall，1980）。

[3]Fischhoff and Beyth-Marom，“Hypothesis Evaluation from a Bayesian Perspective.”

[4]这一替代性的格式是“去个性化”的假定，验证时不再让专家们与其“对手”进行竞争。例如，除了让西欧问题专家们在1998年判断各国在接下来的三到五年内采纳欧元的可能性之外，我们还让判断“时下欧洲的经济和政治一体化是一个长期过程”这一假定的真伪，然后设置了两组条件性似然判断：（a）假定为了该假设明显（100%）为真的观点，判断各国至2001年1月或2008年采纳欧元的条件性似然；（b）假定相反的条件并进行同样的条件性似然判断。两种不同格式的结果其相似程度已经足以证明将数据进行整合的合理性。

[5]一些研究者已经得出结论，认为人们是如此糟糕的贝叶斯者以至于他们根本不能算作贝叶斯者（Fischhoff and Beyth-Marom，“Hypothesis Evaluation from a Bayesian Perspective”）。认知保守主义的早期研究显示，人们过久地执著于他们最初掌握的那仅有的信息——那些信息通常采用各种彩色扑克牌基准率的形式，以此构成了“以前”的信息。参见L.D.Phillips and D.Edwards，“Conservatism in a Simple Probability Inference task，”Journal of Experimental Psychology 54（1966）：346-54。但是后来的研究工作显示，当人们能够通过特定案例的信息构建一个言之成理的因果联系时，他们经常忽视基准率（Nisbett and Ross，Human Inference）。这种混乱将在此迎刃而解，我们的预测者确实过久地执著于他们以前的假定（重复“认知保守主义”），但是那些假设根植于特定案例中起作用的关于政治性因果联系的一种强烈信念，而非建立在特定地区或时期内结果发生频率的数据统计总结之上。的确，这些意识形态图式经常使专家们过高预测低频率结果，如第3章所评述的那样，这可以看做一种对基准率的疏忽。我的经验是，以下情况会使基准率最大程度影响政治判断：当人们没有其他信息时，或已将基准率等同于因果效力时（例如对俄罗斯或伊斯兰的广泛的刻板印象）。

[6]A.W.Kruglanski and D.M.Webster，“Motivated Closing of the Mind：‘Seizing’and‘Freezing，’”Psychological Review 103（1996）：263-68.

[7]刺猬的平均似然比为3.2∶1，狐狸的为2.3∶1，同时，相比于狐狸，刺猬有两倍的可能性将一个不同于自己以前竞争的假定归于零似然性（大概9%对4%）。这产生了一个技术问题，不论何时预测者赋予一个假定为0，信念更新等式都将变得无从定义（因此需要将0记录为0.01并将1记录为0.99）。一旦某个人表达了某件事是不可能的这一观点，那么在贝叶斯理论的架构之内，即使再多的证据也无法使其动摇。我们可以将这种结果视为理论架构的一次失败，或者视为应答者的失败，当将0应用于主观概率时，他们没有意识到自己是多么顽固。

[8]类似效应的实验论证，参见C.Lord，M.Lepper and E.Preston，“Considering the Opposite：A Corrective Strategy for Social Judgement，”Journal of Personality and Social Psychology 46（1984）：1254-66；C.Lord，L.Ross，and M.Lepper，“Biased Assimilation and Attitude Polarization：The Effects of Prior Theorieson Subsequently Considered Evidence，”Journal of Personality and Social Psychology 37（1979）：2098-2109。

[9]“保守主义”在这里并不带有意识形态的含义，与考虑的内容无关，是指保守于现有的心理结构。自由主义者可能，并且经常，同保守主义者在认知保守主义上“同罪”，一些研究者发现认知保守主义效应在意识形态上是对称的：Nisbett and Ross，Human Inference；Z.Kunda，Social Cognition：Making Sense of People（Cambridge：MIT Press，1999）；P.E.Tetlock and A.Levi，“Attribution Bias：On the Inconclusiveness of the Cognition-Motivation Debate，”Journal of Experimental Psychology 18（1982）：68-88。然而，其他一些研究者发现意识形态上的保守者更具有认知保守的趋向，参见P.E.Tetlock，“Cognitive Structural Analysis of Political Rhetoric，”in Political Psychology：A Reader，ed.S.Iyengar and W.J.McGuire（Durham，NC：Duke University Press，1992），380-407。

[10]关于这些模型哪里出了问题，更广泛的分析，参见L.Bartels and J.Zaller，“Presidential Vote Models：A Recount，”Political Science and Politics 34（2001）：9-20；C.Wlezien，“On Forecasting the Presidential Vote，”Political Science and Politics 34（2001）：25-32；J.Campbell，“The Referendum That Didn't Happen：The Forecasts of the 2000 Presidential Election，”Political Science and Politics 34（2001）：33-38；R.Erikson，“The 2000 Presidential Election in Historical Perspective，”Political Science Quarterly 116（1）（2001）：29-52。

[11]萨拉丁（Sladin），埃及阿尤布王朝的创建者。——译者注

[12]拉尔夫·纳德（Ralph Nader），在2000年总统大选中以绿党候选人身份赢得约2.7%的选票。——译者注

[13]Robert Jervis，“The Future of International Politics：Will It Resemble the Past？”International Security 16（1992）：39-73；G.Almond and T.Genco，“Clouds，Clocks，and the Study of Politics，”World Politics29（1977）：489-522.

[14]D.Moynihan，Pandemonium（New York：Oxford University Press，1993）.

[15]“No.2Official of the IMF to Step Down at Year's End，”New York Times，May 9，2001，C5.

[16]参见D.Kenny，Correlation and Causality（New York：Wiley-Interscience.1979）。

[17]关于“朴素证伪主义”和一再拒绝放弃已经遇到尴尬的证据的假设所带来的危机，参见I.Lakatos，ed.，Criticism and the Growth of Knowledge（Cambridge：Cambridge University Press，1972），9-101）；F.Suppe，The Structure scientific Theories（Urbana：University of Illinois Press，1974）。

[18]参见W.J.McGuire，“A Contextualist Theory of Knowledge：Its Implications for Innovation and Reform in Psychological Research，”Advances in Experimental and Social Psychology 16（1983）：3-87。(https://www.daowen.com)

[19]S.Hawkins and R.Hastie，“Hindsight：Biased Judgment of Past Events after the Outcomes Are Known，”Psychological Bulletin 107（1990）：311-27.

[20]J.Campbell and A.Tesser，“Motivational Interpretations of Hindsight Bias：An Individual Difference Analysis，”Journal of Personality51（1983）：605-20；还有一些人认为，事后之明的扭曲在更好的可能世界没能出现时最为显著，因为人们宁愿以将其描述为不可能的方式来避免失望，参见（）.E.Tykocinski.D.Pick，and D.Kedmi，“Retroactive Pessimism：A Different Kind of Hindsight Bias.”European Journal of Social Psychology 32（4）（2002）：577-88。我们没有找到对这一观点的支持。

[21]在第6章，刺猬的辩护者试图弱化事后之明偏见，他们争辩说认知资源是有限的，在了解所发生的事件之后将往事勾销是适应性的一种体现。

[22]尽管两种辩护的相关很弱，一些观察家们还是同时展现了两种效应。如果随着时间的推移，信念在两种功能转变期间为混合的功能服务时，还是有这种可能的。几乎成功的反事实辩护可以在最初作为减震器缓解预测失灵所带来的冲击，正如我们在徜徉历史时：“哎呀，我认为最可能发生的强硬派通过政变挽救苏联的情景没有实现，但它差点儿就发生了。”然而这些几乎成功的辩护逐渐成为了这个世界上我们的思维模式中不可缺少的组成部分，我们必须与之妥协：“经过仔细考虑，我觉得苏联注定会解体，试图避免无可避免之命运的政变注定会失败。”这一修正过的思维方式建立了，并巧妙修改了造成最初明显错误预测的因果推理，这种重建常常如此不着痕迹，以至于观察家们感到他们似乎“一直都知道”，不管是为什么这一结果必然会发生——大致如其实际发生的那样，还是为什么自己曾经预测的可能未来注定不会发生。即便发生预料之外的事件也可以认为是不可避免的，而最初的预测偏差不得不被开脱为一次意外。

[23]Suedfeld and Tetlock，“Individual Differences.”

[24]很多学者已经认可了这些诊断（prescriptions）（相关回顾参见P.E.Tetlock，“Social Psychology and World Politics”），一些聪明的分析师也是如此——谢尔曼·肯特是这些分析师中最为卓越的，他告诫同行们要对最喜爱的信息源保持怀疑，要警惕偏见的力量可能对证据评估产生偏差（S.Kent，Collected Essays，U.S.Government：Center for the Study of Intelligence，1970，http://www.cia.gov/csi/books/shermankent/toc.html）。

[25]E.R.May，Lessons of the Past：The Use and Misuses of History in American Foreign Policy（New York：Oxford University Press，1973）.