使预测准确

2026年07月27日

版权

使预测准确

真理一致性理论把好的判断等同于内在的心理表征与相对应的外在世界特性间的完美匹配。譬如我们相信草是绿的，因为它作为物质世界中一种客观特征是真实的——绿反映了电磁光谱的部分能够被我们的眼睛捕捉到。我们可以同样说如下的信念：现实政治中越没有参照物，预测起来就越不准确，譬如战争爆发、经济衰退。因此，我们应该把好的判断归于那些按照本来面目，或者不久将变成的面目来看待世界的人。[17]由此常常派生两种推论：（1）应该奖励那些对将发生的事有远见的灵魂——20世纪30年代早期看到希特勒带来的威胁，或者20世纪80年代早期看到苏联的不堪一击，或者20世纪90年代看到宗教激进分子的能力，或者2000年看到互联网泡沫的破裂；（2）我们应该惩罚那些误入歧途的灵魂，对于我们大家来说都很明显的事情，他们仍然置若罔闻——如在戈尔巴乔夫任期的最后几天仍然相信苏联采取扩张政策。

然而，对于与好判断直接相关的概念进行大致的评估已经被证明并不是无足轻重的。我们必须通过以下五个方面的挑战[18]：

1.挑战比赛领域是否公平。如果一些预测者预测的任务比其他人简单，我们就有对好判断做出错误归因的危险。在预测罕见的结果时，诸如核扩散，或者金融危机，或者预测常见的结果时，诸如在民主发展良好的国家的常规选举，任何愚蠢的人也可能接近百分之百的预测准确。所有人需要做的是，尽管对结果预测的持久的高基准率——像谚语所说的“破钟”——看上去是好的，但至少要对其怀疑，要用简单的统计运算法则衡量他的表现。

2.挑战预测者的“击中”是否以“虚报”为高昂的代价被售出。如果我们仅仅关注成功的故事——因为对宏大事件预测击中而肯定预测者（譬如预测苏联的登台）但并没有把他们的虚报记录在案（预测国家—民族的分裂，譬如尼日利亚、加拿大，事实上没有出现），我们就有对好判断做出错误归因的危险。每个愚蠢者面对任何结果时也可能有高击中率（不管多么罕见还是平常），而这通过对事件的发生不加区分地预测为高概率就可以做到。我们测量时需要把所有逻辑上可能的预测—结果的匹配考虑在内：说x发生而x发生时（击中）；说x发生而x没有发生时（虚报或预测过度）；说x没有发生而x没有发生时（正确拒斥）；说x没有发生而x发生时（漏报或预测不足）。

3.挑战是否对击中和虚报赋予同样的权重。如果我们把政治推理看作追求总体准确性的毫无感情的练习，我们就有对好判断做出错误归因的危险。讨论预测的准确性时，如果没有详细解释预测者习惯性地在预测过度（虚报：对没有发生的事件赋予高概率）和预测不足（漏报：对发生的事件赋予低概率）之间做权衡，那么这完全是一种误导。[19]试看下面两则案例：

a.20世纪80年代保守人士为了证明他们怀疑戈尔巴乔夫是正确的，坚持认为对苏联的预测不足是更加严重的错误，会诱使我们放松警惕，诱使对方考验我们的决心。与此相反，自由人士则担心对苏联的预测过度会导致我们把大量的金钱花费在过剩的防御计划上，从而强化了苏联因为对我们的怀疑而做最坏的打算。

b.20世纪90年代，西方没有阻止东欧和中非的所谓“大规模屠杀”，批评者认为，如果政治家们憎恶种族屠杀，如同他们勇敢地公开声明“永远不会再发生”，他们对种族屠杀的警告将会比当时更加敏感。西方政策的辩护者对此予以反驳，认为虚报的代价是干预主权国家的内政，是被严厉禁止的，而且会陷入越南战争式的泥淖。

一致性的指标，当然应该是价值中立、对所有错误同等看待、没有任何偏向的。但我们也可能粗心大意，忽略了我们对“错误的”预言者错误归类的可能性，这些预言者做出的决策带有价值倾向，夸大了一些可能性。基于过去的努力，设计的一致性指标对于预测者预测过度与不足的权衡很敏感。技术附录列举了系列的分值调整，预测者因怀疑他们的预测是“正确的错误”而被给予不同的好处。[20]

4.挑战主观概率预测的测量。如果我们无法弄清楚专家预测的是什么，我们将无法评估专家预测的准确性。专家们并不愿意说结果不可能，或者不可避免。他们的表达大多模棱两可，诸如“极小的机会”、“可能”和“很有希望获胜”。核查模糊的、啰唆的表达的正确性是成问题的。“可能性”之类的词有诸多的意思，暗含着多种可能性，从仅超过50%到99%皆有可能。[21]而且核查数字估计的正确性是成问题的。只有判断为0（不可能）和1.0（不可避免）是技术上可以证伪的。对于其他值，一意孤行的预测者认为我们可能会卷入无法确信的世界：低概率事件有时会发生，高概率事件有时不会发生。

为了打破僵局，我们求助于行为决策理论家，他们成功地劝说其他极不情愿的专家把含混的表述转换为数字概率并且能够测量这些判断。[22]关键的考察是，尽管我们从来不知道1988年预测苏联在1993年以前解体的概率是否为0.1，或者加拿大1998年解体的概率是否为0.9，但我们通过许多事件测量这些判断的准确性（再次依赖多数的原则来解决）。这种总体的测量告诉我们怎样区分预测者：与没有发生的事件相比，他们是否赋予接下来发生的事件较大的概率？这些测量同样告诉我们如何更好测量猜测者：他们赋予事件0.10或0.50或0.90的概率，是否大致兑现为10%或50%或90%？技术附录向我们展示了如何改进这些方法以更好将其应用于其他更加细致的准确性的概念。(https://www.daowen.com)

5.挑战现实。如果我们无法认识到正当的模糊性的存在，即关于发生什么或发生什么意味着什么等具体观点的真伪，我们就有对好判断做出错误归因的危险。

对于发生的事一致认同常常是不可及的。民主和共和两党始终相信2000年总统大选最大的遗憾是对方与司法系统相勾结以窃取选举结果。我们大体的意见是，只要有可能我们尽可能准确说明我们的结果，以便能够通过方法论附录中所列举的立见分晓的测试。其中最重要的是洞知力测试：如果我们要帮助专家的预测达到真正洞知的程度，我们的测量就必须对未来的可能性解释得非常清楚，以至于我们能够得知——不需要另外的解释［“一个波兰的庇隆（Polish Peron），你的意思是，或者……？”］——谁预测的什么方面是对的。这项测试排除了亨廷顿（Huntington）或福山（Fukuyama）先知型的声明：预计会发生文明的冲突或历史的终结。在可能的程度上[23]，我们的测量应该聚集于质朴的事实，它们发生在一些人利用媒体包装它们之前：在“国防支出占GDP的比重”的前面，被修饰性地转译为“鲁莽好战”或“谨慎预防”。

深层的问题是——因为没有现成的测量方法可以确定以解决在事件发生后果上的分歧，对相互竞争的观点进行修正。在预测者有机会把事情搞砸之前，许多人警告预测的标准是不公正的——不公正是因为存在过度赞扬仅仅因为运气而获胜的人，大加指责仅仅因为倒霉而失败的人。

这些抗议并不仅仅是躲在象牙塔中为了自我利益所做的尝试，以逃避对现实世界出现的证据的责任。预测和解释并不像过去所设想的那样紧密结合在一起。[24]没有预测的解释是可能的。一个概念上微不足道但实际上却是预测失败的重要之因的情况发生在当我们拥有一种正确的理论时，但是却不知道该理论的前提条件是否满足：高中物理告诉我散热器在低于0℃时会被冻住，但是却没有告诉我今天晚上将会有多冷。或者有些例子中，我们掌握了正确的知识，了解了前提条件，但仍然受挫，是因为结果容易受无序的振荡的影响。地球物理学家明白板块构造导致地震的原理，并且掌握地震的前提条件，但是仍然无法预测地震。

反之，没有解释的预测也是可能的。古代的天文学家关于星星有许多稀奇古怪的想法，但是并没有妨碍他们认识星空的规律，几个世纪以来航海者经常用这些规律来导航。现在的天文学家能够预测太阳风暴的规律，但是对于什么会导致地球强有力的咝咝声的爆发只有粗浅的了解。对于多数科学家来说，仅仅预测是不够的。如果南希·里根（Nancy Reagan）的占星家能够在一系列的预测中奇迹般的百发百中，那么少数科学家可能会改变他们有关天文学的看法。这种结果会掏空科学家群体的核心信念，他们一直认为长期地、努力地坚持寻找影响成功的其他机制是正确的。

这些观点突出了对真理的简单一致性理论的有效反对。而且，对预测失败来说，结果的复杂性创造的远非机遇。当英雄遇到类似的尴尬时，“没有预测的解释是可能的”这一观点能够形成潮流并不是偶然的。“圣雄”甘地1940年发表过极其天真的演讲，他并不认为阿道夫·希特勒像“通常所描述”的那样坏，而且“他获得的胜利似乎并没有流血”[25]。但和平主义者并没有因这样的言论而抛弃甘地的理论。同样，保罗·奥利克（Paul Ehrlich）在20世纪70、80年代预测大量食物短缺就像新技术产生大量剩余一样，但许多环保主义者仍然为他积极辩护。[26]共和党人不会仅仅因为马丁·费尔德斯坦（Martin Feldstein）预测克林顿政府1993年的预算将导致未来十年经济的停滞，而改变对民主党政府经济能力的看法。[27]社会民主党人不会仅仅因为莱斯特·瑟罗（Lester Thurow）预测20世纪90年代将见证欧洲和日本等更加“仁慈”的资本主义将压倒“落后者遭殃”的美国模式，而全面修正他们的世界观。[28]

反之，当我们的对手为他们的预测获胜而洋洋自得的时候，“没有解释的预测是可能的”这一观点能够流行也不是偶然的。把我们对手的胜利看作运气，自己的失败看作倒霉。在每一方纷纷宣布在自己的领域预测获胜之后，我们有一个小小的疑惑，即每一次预测准确的狂热痴迷者，很少被作为好判断的标杆。

然而，社会逻辑的扭曲，不应该让专家们逃避责任。科学家们嘲笑对过去的规律重新描述的解释是空洞的同义反复——他们很少耐心地为一贯的预测记录不佳作辩解。折中的评估应该认识到预测是有问题的，但对于我们理解因果机制来说，绝不是无用的。从长远来看（运用多数原则在大量的问题上进行了大量的预测），对我们观点的信心会随着预测的成功和失败而忽高忽低，准确的数量取决于预测者事前主动地运用理论进行的投注，以及事后面对意料不到的结果，我们愿意给予预测者解释的权重。