寻求妥协：怀疑的社会改善论

2026年07月27日

版权

寻求妥协：怀疑的社会改善论

激进怀疑论者对专家意见的象牙塔堡垒的攻击，造成了重大的——即使不是不可弥补的——声誉受损。多数专家的自我受到贬损：在他们被揭示出来相比于业余爱好者没有更多的预测技巧，相比简单的外推算法拥有更少的技巧时。但是这并不是人们所想要达到的结果，如果他的目标是博得媒体的喝彩或获得丰厚的咨询合同，哪怕只是从同行们到一场鸡尾酒会上对时事的插话而获得的一点尊重。太多的人将会有同样的反应，就像一个富有攻击性的怀疑论者说的：“坚持匿名是这些人做的唯一一件有远见的事情。”[49]

因此，有一种情况，即封存科学的案例，劝告专家们将他们膨胀的自我概念与他们适度的成绩保持一致。但是这种封存的情况也是有弱点的。大量的证据表明，社会改善论者寻找的好判断的相关性因素并不像激进的怀疑论者所描绘的那样不切实际。有许多细微的迹象表明概略的“人类与机械算法”或者“专家与业余爱好者”的比较掩盖了在预测技巧上的系统的个体差异。社会改善论者也许是对的，好判断不能归结为好运气。

顽固的怀疑论者将会抵抗到底。他们明白改善论者所考虑采取的自然的下一步没有任何意义：超越对预测者整体的概括，探讨预测技巧的变化，让我们可以更巧妙地回答以下形式的问题：“谁是正确的，关于什么，何时，为什么？”之所以没有意义，是因为我们现在知道预测技巧上的变化依然是大致正常分布的，并意味着比偶然性高不了多少而略低于具体案例的外推算法。专家们平均来说几乎没有预测技巧，可是一些幸运的人得分更高而其他人得分更低，如果是这样的话，难道我们不是在明确期望这些吗？毫无疑问，如果一个人关注的时间足够长，就会发现一些事件与别的事件相关。但是一个人为追求虚幻的目标关系耗尽资源，新时期来临时这种关系却无法延续下去，就像米尔德里德姨妈（Aunt Mildred）的占星术使得她上周在轮盘赌上的表现屡试不爽（现在却失灵了）。广告宣传中要求呈现真实的任何探求都超越了第2章，这不是作为有能力做出令人惊叹的准确预测的相关性，而是作为有能力避免重大错误的相关性，该错误能够使特殊群体的预测深陷负数水平，即低于一个人依靠基准率或过去预测算法所能达到的值。

忽视怀疑论者的警告将会是轻率的。但忽视改善论某些有效的强烈暗示也将会是轻率的，尽管预测技巧的绝对水平已经引不起人们的兴趣了——在技巧方面的相对差异应是必然的。告诉掌权者事实的专家不会马上被外推算法所取代。而且，在这些专家中，为好判断开列的概念药方中并不缺乏竞争性的观点。这些观点的支持者定期地在杂志、会议和电视脱口秀上发表他们相互冲突的意见——这些意见只有在听众认可信息源知道关于未来的一些事情而他的对手不知道时才具有修辞的力度。减税或会帮助或会妨碍GDP增长或者对GDP增长没有影响；对弹道导弹防御计划的追求将会有好的、坏的或者两者混合的影响。现有的方法就是承诺确定哪一种视角与更为准确的预测相关。大致记录一个“谁预测什么是正确的”，就像《华尔街日报》或《经济学人》所做的记录练习服务于股市和宏观经济学那样，提供同样的公共服务功能：提供对夸大的自我提升的现实检查，以及帮助消费者在观念的市场上判断相互竞争的供应商的质量。

最后，不管放弃社会改善论者对好判断的圣杯（Holy Grail）的追求是不是草率的，大多数人感觉到这是草率的。当我们将一类（TypeⅠ）错误（找到好判断的相关性将被证明是短暂的）的危险与二类（Type Ⅱ）错误（没有发现持久关联的永久性分值）的危险进行权衡时，感觉好像两者并不在伯仲之间。我们宁愿冒着被标记为幸运的傻瓜的风险而忽视明智的忠告。对我们中的大多数人来说，激进的怀疑论作为一粒学说药片太苦而无法下咽。

[1]有关后来对此事所进行的深入思考，参见L.M.Bartels and J.Zaller，“Presidential Vote Models：A Recount，”Political Science and Politics 34（2001）：9-20；M.S.Lewis-Beck，and C.Tien，“Modeling the Future：Lessons from the Gore Forecast，”Political Science and Politics 34（2001）：21-24；C.Wlezien，“On Forecasting the Presidential Vote，”Political Science and Politics 34（2001）：25-32；J.E.Campbell，“The Referendum That Didn't Happen：The Forecasts of the 2000 Presidential Election，”Political Science and Politics 34（2001）：33-38。

[2]S.J.Gould，Bully for Brontosaurus：Reflections in Natural History（New York：W.W.Norton，1991）.

[3]H.F.Pitkin，Fortune Is a Woman：Gender and Politics in the Thought of Niccolo Machiavelli（Berkeley：University of California Press，1984）.

[4]Martin Gilbert，Churchill：A Life（New York：Holt，1991）.

[5]G.Gorodetsky，Grand Delusion（New Haven，CT：Yale University Press，1999）.

[6]G.Soros，Open Society：Reforming Global Capitalism（New York：Public Affairs，2000）.

[7]Gilbert，Churchill.

[8]B.Arthur，Increasing Returns and Path-Dependence in the Economy（Ann Arbor：University of Michigan Press，1994）；P.Pierson，“Increasing Returns，Path Dependence，and the Study of Politics，”American Political Science Review 94（2000）：251-67.

[9]Arthur，Increasing Returns，112-14.

[10]Douglas C.North，Institutions，Institutional Change and Economic Performance（Cambridge：Cambridge University Press，1990）；D.C.North and R.P.Thomas，The Rise of the Western World：A New Economic History（New York：Cambridge University Press，1973）.

[11]Jack Goldstone，“Europe's Peculiar Path：The Unlikely Transition to Modernity，”in Unmaking the West：What-If Scenarios That Rewrite World History，ed.P.E Tetlock，R.N.Lebow，and G.Parker（Ann Arbor：University of Michigan Press，2006）.

[12]J.Mokyr，“King Kong and Cold Fusion：Entities That Never Were but Could Have Been，”in Tetlock，Lebow，and Parker，Unmaking the West.

[13]D.Yergin，The Prize：The Epic Quest for Oil，Money and Power（New York：Simon & Schuster，1991）.

[14]J.Gleick，Chaos：Making a New Science（New York：Viking，1987）.

[15]P.Bak and K.Chen，“Self-Organized Criticality，”Scientific American 264（January 1991）：46-53.

[16]D.McCloskey，“History，Differential Equations，and the Problem of Narration，”History and Theory 30（1991）：21-36.

[17]参见R.Cowley，What If？The World's Foremost Military Historians Imagine What Might Have Been：Essays（New York：Putnam，1999）；Tetlock，Lebow，and Parker，Unmaking the West。

[18]Robert Fogel，Without Consent and Contract：The Rise and Fall of American Slavery（Boston：Houghton Mifflin，1989）.

[19]Joel Mokyr，The Economics of the Industrial Revolution（Totowa，NJ：Rowman & Allanheld，1985）.

[20]McCloskey，“History，Differential Equation，”36.

[21]McCloskey，“History，Differential Equation，”36.

[22]Arthur Conan Doyle.The Complete Sherlock Holmes（New York：Garden City，1938）.

[23]Rosmarie Nagel，“Unraveling in Guessing Games：An Experimental Study.”A-merican Economic Review 85（1995）：1313-26.

[24]Richard Thaler，“From Homo Economics to Homo Sapiens，”Journal of Economic Perspectives 14（2000）：133-14.

[25]这不是近期的洞察。卡尔·冯·克劳塞维茨（Carl von Clausewitz）证明了为何“战争最类似于一场纸牌游戏”。好的发牌确实有帮助，但是经验丰富的扑克玩家知道，没有比太相信预见性的方式更让一个人输得血本无归［Carl von Clausewitz，On War，ed.and trans.Michael Howard and Peter Paret（Princeton，NJ：Princeton University Press，1976）；亦可参见Erik Gartzke，“War Is in the Error Term，”International Organization 53（1999）：567-87；R.Jervis，“The Future of World Politics，”International Security 16（1991/1992）：39-73］。

[26]William A.Sherden，The Fortune Sellers（New York：Wiley，1998）.

[27]R.Dawes.“The Prediction of the Future Versus an Understanding of the Past：A Basic Asymmetry，”American Journal of Psychology 106（1993）：1-24.

[28]B.Brehmer.“In One Word：Not from Experience，”Acta Psychologica 45（1980）：223-41；P.D.Werner，T.L.Rose，and J.A.Yesavage，“Reliability，Accuracy.and Decision-Making Strategy in Clinical Predictions of Imminent Dangerousness.”Journal of Consulting and Clinical Psychology 51（1983）：815-25；H.Einhorn and R.Hogarth.“Confidence in Judgment：Persistence of the Illusion of Validity，”Psychological Review 85（1978）：395-416.(https://www.daowen.com)

[29]R.Dawes.“Behavioral Decision Making and Judgment，”in The Handbook of Social Psychology，4th ed.，vol.1.，ed.D.T.Gilbert，S.T.Fiske，and G.Lindzey，497-548（New York：McGraw-Hill，1998）；S.Fiske and S.Taylor.Social Cognition（New York：McGraw-Hill，1991）。广泛依赖的简单启发式因为表现不佳而广受指责——尽管有关于这些简单启发式多久一次将我们引入歧途存在着激烈的辩论。

[30]Robert Jervis.Perception and Misperception in International Politics（Princeton.NJ：Princeton University Press.1976）.

[31]P.E.Tetlock.“Social Psychology and World Politics.”in Fiske.Gilbert，and Lindzcy.Handbookof Social Psychology.

[32]R.E.Neustadt and E.R.May.Thinking in Tine：The Uses of History for Decision-Makers（New York：Free Press，1986）.

[33]H.Einhorn and R.Hogarth，“Behavioral Decision Theory，”Annual Review of Psychology 31（1981）：53-88.

[34]P.E.Tetlock and P.Visser，“Thinking about Russia：Possible Pasts and Probable Futures，”British Journal of Social Psychology 39（2000）：173-96；G.W.Breslauer and P.E.Tetlock，Learning in U.S.and Soviet Foreign Policy（Boulder，CO：Westview Press，1991）.

[35]R.P.Abelson，E.Aronson，W.McGuire.T.Newcomb，M.Rosenberg，and P.Tannenbaum，eds.Theories of Cognitive Consistency：A Sourcebook（Chicago：Rand McNally.1968）.

[36]E.J.Langer，“The Illusion of Control，”Journal of Personality and Social Psychology 32（1975）：311-28.

[37]有关在随机数据中追求某种模式时“过于聪明”的危险，参见Ward Edwards，“Probability Learning in 1000 Trials，”Journal of Experimental Psychology，62（1961）：385-94。

[38]Dawes，“Behavioral Decision Making.”

[39]J.Koehler.“The Base-Rate Fallacy Reconsidered：Descriptive，Normative，and Methodological Challenges，”Behavioral and Brain Sciences 19（1996）：1-53.

[40]A.Tversky and D.Kahneman，“Extensional Versus Intuitive Reasoning：The Conjunction Fallacy in Probability Judgment，”Psychological Review 90（1983）：293-315；有关了解什么是相关参照分类的困难，参见R.Jervis.“Representativeness in Foreign Policy Judgments，”Political Psychology 7（1986）：483-505。

[41]P.G.Allen，“Econometric Forecasting，”in Principles of Forecasting，ed.，J.S.Armstrong，303-62（Boston：Kluwer，2001）；M.Singer and A.B.Wildavsky，The Real World Order：Zones of Peace，Zones of Turmoil（Chatham，NJ：Chatham House，1996）.

[42]这并不意味着容易搞清楚用哪一个基准率。难道我们应该把自己考虑的问题限制在近期，或者在狭义界定的区域，或者在特定的国家？我们简单的算法用了一系列的基准率，它们在时间（5年、10年和25年）、政权类型的特殊性（稳定的民主制、不稳定的民主制、独裁等）和区域特殊性（尼日利亚、非洲西部、非洲、全世界）上各不相同。

[43]T.Gilovich.R.Vallone，and A.Tversky，“The Hot Hand in Basketball：On the Misperception of Random Sequences，”Cognitive Psychology 17（1985）：295-314.

[44]A.H.Murphy and R.L.Winkler，“Probability Forecasts：A Survey of National Weather Service Forecasters，”Bulletin of the American Meteorological Society 55（1974）：1449-53.Murphy，“Scalar and Vector Partitions，Parts Ⅰ and Ⅱ.”

[45]Yates，Judgment and Decision Making.

[46]读者可能会惊讶于简单的具体案例外推算法有时与正式的时间序列模型（属于一般自回归分布滞后模型的类型）的表现差不多。我们应该期望这一类型结果，无论何时真正的随机过程支配了被预测的变量（称为yt），它是通过一个自回归过程的指令达到的，没有其他的变量是yt的有用预测。在这种情况下，理性的预测者会采用简单的规则，例如下一阶段的值将会是yt-2+（1-ρ）×m，其中yt-2是最后一个阶段的值，ρ是一些小于或等于1的常量以表明变量的“持续性”，m是非条件变量的平均数，随着时间的推移这些变量会回复（例如，当ρ为1的时候，变量遵循随机游动）。只有变量的过去值对未来有预测作用。

[47]W.M.Grove and P.Meehl，“Comparative Efficiency of Informal（Subjective，Impressionistic）and Formal（Mechanical，Algorithmic）Prediction Procedures：The Clinical-Statistical Controversy，”Psychology，Public Policy，and Law2（1996）：293-323.

[48]读者也许会注意到这里有一个结果分类的转换——从赋予中立的“在某事的或多或少的方向上改变”到有分值负载的“变好或变坏”。这种转换一般来说不成问题，因为在执行分值调整的过程中，我们简单地采用了专家一致同意的“什么是好的或坏的”观点，而抛弃了那些有尖锐分歧的变量。比如说，专家以压倒性的多数同意变好，包括更多的GDP、更低的失业率、更少的中央政府债务占GDP的比重、更少的国家内部或国家间的武装冲突、更低程度的腐败、更高的透明度、更高的政治和经济自由以及更少的拥有核武器的国家。但是，当我们考虑到价值观的个体差异时，结果是大不相同的（比如对欧元持怀疑态度的人更愿意放弃货币一体化计划.欧元的热衷者则希望相反的情况，而十分频繁的争论则出现在某些国家的领导人更替是否合理上）。

[49]这里所运用（参见方法论附录）的政治专家的定义，见到此的读者也许会感到选取的解释并不公正。他们不应该这样。尽管这个课题的目的并不在于比较来自不同领域的专家在预测工作中的表现有多好，但我们可以有把握地断言，自认为他们是好的预测者，好于对他们的描述，这方面政治专家并不是个案。具有很高知识层次的专家与死气沉沉的预测表现这两者共存是一个普遍现象。参见C.Camerer and E.Johnson，“The Process-Performance Paradox in Expert Judgment：How Can Experts Knows So Much and Predict So Badly？”in Toward a General Theory of Expertise，ed.K.A.Ericsson and J.Smith，195-217（New York：Cambridge University Press，1991）；H.Arkes，“Overconfidence in Judgmental Forecasting，”in Principles of Forecasting，ed.S.Armstrong，495-516（Boston：Kluwer，2001）。在后面几章论述中，下面的说法也是公平的：政治专家容易受偏见的影响，包括信念持续性、基准率忽视以及事后之明偏见。参见N.V.Dawson，H.R.Arkes，C.Siciliano，R.Blinkhorn，M.Lakshmanan，and M.Petrelli，“Hindsight Bias：An Impediment to Accurate Probability Estimation in Clinicopathologic Conferences，”Medical Decision Making 8（1988）：259-64；W.D.Gouvier，M.Uddo-Crane，and L.M.Brown，“Base Rates of Post-concussional Symptoms，”Archives of Clinical Neuropsychology3（1988）：273-78；G.B.Chapman and A.S.Elstein，“Cognitive Processes and Biases in Medical Decision Making，”in Decision Making in Health Care，ed.G.B.Chapman and F.A.Sonnenberg，183-210（Cambridge：Cambridge University Press，2000）。然而，这些比较不会总是这样让人舒服的。还是存在一些领域，专家在校准上特别好而且他们的表现大大超过业余爱好者。参见A.H.Murphy and R.L.Winkler，“Probability Forecasting in Meterology，”Journal of the American Statistical Association 79（1984）：489-500；G.Keren，“Facing Uncertainty in the Game of Bridge：A Calibration Study，”Organizational Behavior and Human Decision Processes 39（1987）：98-114。跨领域的差异也许是由于综合因素的影响。对预测准确性的快速、明确的反馈促进了优越的表现。同样，行业内的规范也鼓励对抗，而不是为了避免错误而据理说明（这是政治领域一个极其严重的缺点，我们将在第4章论述，而在第8章中我们提出可能的解决方法）。