与信念内容相关
政治信念体系可以在许多维度上变化,预测者的项目单越长,利用机缘的危险就越大。为了在应对这些反对意见时占据主动地位,我用最大似然的因子分析把问卷条目不易控制的数量(13个)减少至主题复合的易控制的数量(一个三因子的解决方案)。[1]表3—2呈现出在每个因子上的每个变量的负载系数。在一个因子上一个变量的负载系数越高,那么在其他因子上的负载系数就越低,这个变量独特地界定此因子就越重要。这些作为结果的因子如下。
表3—2 源自信念体系条目的最大似然因子分析(四次幂最小旋转)的旋转因子矩阵变量的负载系数
续前表
注:“*”号突出每个因子中五个最高的负载系数,每列顶端描黑的标记突出高负载系数之义。
左派与右派
左派想要纠正国内以及国际的不平等,他们对以下问题持保留意见:在向市场经济的迅速转型中,贸易自由化的影响和不受限制的资本流动对监管体制薄弱国家的影响;同时担心对穷人和自然环境造成恶劣的消极影响。右派热衷于市场的解决方案,但是对将注意力从财富创造转向财富分配的“政府干预”持强烈的保留意见。引用一句话就是:“政府失灵比市场失灵更常见。”
制度主义者与现实主义者
现实主义者承认,不管对新世界秩序做如何渲染,世界政治依然保持“丛林”状态。他们小心翼翼地将国家政策置于国际制度之下,同时在金钱和权力都不可靠时相信言语和承诺。他们也担心“俄罗斯套娃式民族主义”的力量,在其中,分裂主义者打破了现有的国家,然后又分裂成各种派系以试图从分裂出的部分中逃离。[2]制度主义者看到了更多的潜能,能够超越现实主义、国家主义、威慑等“残酷的”逻辑。他们强调协调国家政策与国际机构的必要性,强调新观念改变国家利益旧有解释的能力,以及强调未能考虑涉事其他各方的忧虑的危险。
悲观论者与锋芒论者
锋芒论者强调生态系统的弹性(它们“快速恢复”的能力)和人类在应对稀缺资源时的机智(在艰难的条件下,只有坚强的人才能前行,代替不可再生资源的效能成本核算的替代品也随之出现)。他们把发展经济和高科技的解决方案放在首要位置,最激进者相信,随着人工智能和分子生物学的进步,相比于20世纪晚期在地球上游荡的笨拙的、病态的而忧郁的原始人类,人类正进入一个更聪明、更健康、更愉快的历史上的后人类阶段。悲观论者强调生态系统的脆弱性,促进可持续发展以及生活的地球“承载能力受限”的紧迫性。激进的悲观论者相信,人类行走在错误的轨道上,结果导致了穷国与富国间“荒唐程度的”收入差距,导致了对自然的“犯罪式的掠夺”,以及随着资源稀缺加剧了种族和宗教的不满,导致了第三世界暴力的增加。
总体来说,这三个因子展现了许多参与者的世界观。[3]但是在我们对拥有预测技巧的预测者做全方位的研究时,这些内容因子几乎不能提供帮助。图3—1——将应答者在每个因子上分为低、中、高得分者——表明不论是低还是高得分者,都没有在校准和鉴别上拥有显著的优势。这种无效结果在混乱和稳定地区以及预测主题上都得到了支持。然而,图3—1提供了一点微弱的希望,表明社会改善论者对好判断相关性的寻求不是不切实际的。在校准上温和派一直优于极端派——这种优势并不是他们通过牺牲鉴别换来的。[4]
图3—1
源自因子分析,预测者对左派—右派、现实主义者—理想主义者和锋芒论者—悲观论者“内容”量表上的态度作用产生的校准和鉴别分。数据的暴跌出现在预测的所有领域(包括混乱地区和稳定地区),包括各种预测主题,如政治、经济和国家。(反思性)的校准分越高,显示越有能力赋值主观概率,以与客观的结果相对频率相一致。鉴别分越高,显示有能力赋值发生的事件(与没有发生相比)的概率越高。
尽管内容因子证明了所有预测者的表现都是无力的,但可以简单地辨认出在哪个时间和哪个地点一个或另一个的派别可能在吹嘘它的成功。我们应该很快地发现,与大出风头假设相一致,不同的案例之间,存在着立场改变很快的人,他们甚至每时每刻都在转变。
与认知方式相关
所有的时间和主题中,当关注的中心从“专家想什么”到“专家如何想”时,对好判断相关的研究就变得更成功了。表3—3呈现的是测量认知方式的13个条目,以及最大似然因子分析的结果。在第一个因子上的低变量负载系数和高变量负载系数,与以赛亚·伯林在思想史上著名的刺猬和狐狸的区分有惊人的相似之处。[5]
低得分者就像刺猬一样,是“知道一件大事”的思想者,积极地把一件大事的解释范围扩展到新的领域,对那些“没有理解的”显得极不耐烦,对于已经是非常精通的预测方面显得极有信心,至少在长期来看是这样的。高得分的人就像狐狸一样,是知道许多小事(他们行业的窍门)的思想者,对宏伟的计划持怀疑态度,他们不把解释和预测看做推论的练习,而是把它看成是需要凝聚不同的信息来源的灵活的“决策”练习,而且他们对自己预测的本领相当不自信,同时——就像第2章中的怀疑论者一样——对像云一样的政治主体能够成为像时钟一样的科学的客体相当地怀疑。[6]
表3—3 推理方式条目中最大似然因子分析所产生的旋转因子矩阵中的变量负载系数(负载系数越高显示越像狐狸式的认知方式或越果断的方式)
续前表
认知方式相关的测量只与三个内容因子微弱地相关(所有的r's<0.10)。在所有的小群体中都可以发现刺猬和狐狸。但是他们不是随机地分布于政治思想的三个维度上。狐狸更有可能成为中立者。当我们评估具体样本的极端主义时——通过计算每一个专家在每一个维度上的得分和在那个维度上的平均值的平方差——所产生的测量与狐狸式专家的推理方式偏好的相关是0.31。这些相关性后来将会帮助精确定位刺猬——面临各种说服的情况下——所犯下的最大错误。[7]
尽管这样,最值得注意的是,作为全方位预测技术指标,认知方式中的刺猬—狐狸维度所具有的力量。刺猬—狐狸维度所做的与政治取向的“内容”测量没有关系,也与专业背景的测量没有关系,它能够做的是:不管区域、主题和时间如何,都能够把有优秀预测记录的观察者从现有情景中区分出来。
图3—2绘制了预测者的32个子集的校准和鉴别值(来源于一个4×2×2×2的划分,插图说明对此做了区分)。
结果证实了温和的社会改善论者的论点:第2章原始人类与黑猩猩的比较,以及专家与业余爱好者的比较,掩饰了预测技巧上系统性的差异,这种差异不仅仅是随机性的。有些人类认知方式的亚种一直胜过其他的。在准确性的两个最基本测量上——校准和鉴别——狐狸比刺猬拥有压倒性优势。狐狸和狐狸式刺猬的校准分(在认知方式刻度上的第一个四分位数和第二个四分位数的得分)在0.015附近徘徊,这意味着他们所赋予的主观概率值(1.0,0.9,0.8,...)平均偏离于客观频率值(0.88,0.79,0.67,...)12%;相反,刺猬和刺猬式狐狸的校准分(在认知方式刻度上的第三个四分位数和第四个四分位数的得分)在0.035附近徘徊,这就意味着主观概率值—客观现实的平均差距为18%。狐狸和狐狸式刺猬的鉴别值平均为0.03(意味着他们大约获得了预测的方差的18%),而刺猬和刺猬式狐狸的鉴别值平均为0.023(意味着他们大约获得了方差的14%)。
但是结果不支持更大胆的社会改善论者的论点:某种思维方式产生的预测准确性确实可以媲美,甚至超过了正式的统计模型。只有表现最好的狐狸接近于概略具体案例外推算法的预测准确性(在图3—2的右上角的编号35和36),而没有任何一个甚至接近于自回归分布滞后模型(在更远的右上角的编号37)。
图3—2因此支持了人类表现。它显示了最好的预测者并不是无所不知的:在所有的练习中,他们幸运地接近了理想认识的20%,外推算法接近30%,正式的模型达到50%。[8]而且它展现了人类表现有多差——即使受过高等教育的专家解释的方差也少于7%,而且落在了比黑猩猩的相同猜测策略更低的总技巧曲线上。[9]
图3—3和3—4补充了图3—2。图3—3描绘了一系列的校准函数,展现了以下事实:在整个的主观概率尺度上,狐狸—刺猬间有多大的差异;当狐狸在他们的专业领域内作出短期预测时,与完美校准的对角线多么接近;当刺猬在他们的领域内作出长期预测时,偏离理想状态有多远。图3—4将大家的焦点放到了刺猬是意识形态上的极端派上,在他们的专业领域内作出长期预测时,狐狸—刺猬的差异是如何变得突出的。
图3—2
所显示的是,在预测准确性的两个指标校准和鉴别上,做短期或长期的预测时,狐狸和狐狸式刺猬(认知方式量表中的第一和第二四分位数)如何完胜刺猬和刺猬式狐狸(第四和第三四分位数)。将数字转换为可区分的亚群体和任务如下:单纯的狐狸(1~8)、单纯的刺猬(25~32)、狐狸式刺猬(17~24)和刺猬式狐狸(9~16);温和派(1~4,9~12,17~20,25~28)和极端派(5~8,13~16,21~24,29~32);专家(1~2,5~6,9~10,13~14,17~18,21~22,25~26,29~30)和业余爱好者(3~4,7~8,11~12,15~16,19~20,23~24,27~28,31~32);短期(2,4,6,8,10,12,14,16,18,20,22,24,26,28,30,32)和长期(1,2,5,7,9,11,13,15,17,19,21,23,25,27,29,31);不需动脑的演算(黑猩猩——33)、基准率的外推法(34),以及温和和极端的具体案例外推法(35,36);形式统计的平均表现(一般自回归分布滞后——37)和伯克利的本科生(38)。
图3—3
四个预测群体的校准函数与完美的校准(对角线)的比较。偏离对角线越远,最终的校准分的差距越大,预测越差。
仔细考察这三个图,我们可以清楚地得出四项主要结论:
1.狐狸在鉴别上的优势具有广泛的适用性。显示的数据在所有维度上——在专家与业余爱好者、温和派与极端派,以及短期预测与长期预测上——都得到了支持,而且即使在没有数据显示的两个附加维度上——稳定地区与混乱地区,国内政治、经济与国家安全——也得到了支持。[10]只有当狐狸式的预测者变得不那么像狐狸的时候(在“狐狸式刺猬”中),同时当刺猬式的预测者变得像更像狐狸的时候(在“刺猬式狐狸”中),狐狸的优势才慢慢消失。在这里我们发现了在校准上的最大的一组“统计关系”(在图3—2中,数据点是9,10,11,12,13,15,19,20,22,23)。
2.但是对于某些子群来说,狐狸在校准上的优势更加明显。表现最差者是在其专业领域内作出长期预测的刺猬式的极端派。从那个低凹处(尤其见图3—4),随着我们从专家移到业余爱好者,从长期预测移到短期预测,以及从极端派移到温和派,刺猬的表现提高了。相反,表现最好的人是在其专业领域内作出短期预测的狐狸。从那个顶点处(见图3—4),随着我们从专家移到业余爱好者,从短期预测移到长期预测时,狐狸的表现下降了。
图3—4
刺猬和狐狸的温和派、极端派,或作为业余爱好者的校准分。
3.对于一些刺猬式思维的辩护者提出的下列观点没有得到支持:“狐狸只是懦夫而已”、“狐狸在校准上的胜利就像第2章的黑猩猩的相同猜测策略在相同变量上的胜利一样在智力上是愚蠢的”。如果狐狸已经不加区别地小心谨慎,他们——像黑猩猩一样——将会在鉴别指数上溃不成军。但是相反的情况发生了。狐狸在鉴别上具有统计上显著的优势——就像在校准上所出现的一样,只有当我们比较最不像狐狸的狐狸与最像狐狸的刺猬的时候,它才慢慢消失。同样地,正如在校准里所出现的一样,我们发现,表现最差的刺猬依然是以专家的身份做出长期预测的极端派。而表现最好的狐狸依然是以专家的身份做出预测的温和派。这些结果攻陷了刺猬专家辩护的主要阵地。图3—2强调了这一点,它显示不可能区分出任何一套看似合理的(单调的)不变的概率得分曲线,以与刺猬在校准上失败的假定一致,因为舍校准取鉴别,在做这样的权衡时他们非常谨慎。雪上加霜的是,图3—2显示,产生貌似合理的无差别的曲线,以与刺猬和掷飞镖的黑猩猩拥有相同的预测技巧的假定相一致,是非常容易的。但实际上在校准和鉴别的权衡方面两者却存在巨大的差异:黑猩猩的“相等猜测”策略“选择”更多的校准,作为交换得到了0的鉴别分;而刺猬“选择”了更少的校准,作为交换得到了一些鉴别分。[11]
4.狐狸—刺猬差异的模式对其他变量结果的解释有所启示,特别是专门知识、预测的范围和意识形态的极端倾向。例如,尽管第2章的专业知识对预测准确性没有全面的影响,但零效应是误导性的。狐狸从专业知识中获得了适度的好处,相反,刺猬——说来也怪——受到了损害。还有,尽管长期预测平均来看没有短期预测准确,但其主要影响是欺骗性的。它完全由刺猬的长期预测时更大的错误所驱动。最后,尽管极端派平均来看没有温和派预测得准确,但是其主要影响也是误导性的。它不是由狐狸,而几乎完全由刺猬式的极端派的预测准确性的锐减所驱动。
总之,在校准和鉴别上,狐狸和刺猬之间表现的差距在统计学上是可靠的,但是差距的大小至少由三个其他的变量所调解:极端倾向、专业知识和预测范围。这“三种层次”的交互作用通过了严格的显著性检验[偶然出现的概率(有条件的无效假设是真的)小于1%],因此对于怀疑论者来说,把它们视为误差而不加以考虑是困难的。[12]而且,这些交互作用带来了深远的挑战。我们通常期望知识能够提高准确性(我们教育制度中的工作假定)。因此,如果在第2章中发现我们达到知识的收益递减点有多快是令人惊讶的,那么在第3章中发现知识对一小部分的预测者阻碍如此之大就是彻头彻尾地令人不安的。
但是,这个结果非常适合认知过程的解释,它利用了心理学对认知方式和动机推理的研究。这个解释始于以下假定,刺猬在测量闭合需求和结构人格特质量表上拥有一个与高得分者很强的家族相似性——这种类型的人在实验性研究中更有可能把影响他们的先入之见的证据变得无足轻重,接受那些强化他们的先入之见的证据。[13]接下来这种解释假定,刺猬拥有的相关知识越多,他们不得不实施信念体系辩护和支持性的任务时所拥有的知识论据就越多。相反,狐狸——在同样的人格特质量表上与低得分者相似——可能预先倾向于用一个更加平衡的方式分配他们的认知资源,以服务于自我批评与自我辩护。当狐狸式的专家利用他们的知识储备来判断未来发展趋势的时候,他们应该在每一个可能性上对正面的和反面的论证给予大致相等的关注。因此应该预期存在一种专业知识与认知方式的交互作用:当一个人在作判断性的任务时有大量的思维资本,他偏好的思维方式就会有更大的潜力影响判断。
下一个对认知过程解释的挑战是,解释为什么对于更长期的预测来说,狐狸和刺猬间的表现差距竟然更大。当我们要求预测者展望更长远的未来时,大多数变得更加没有信心。可以理解的是,他们感觉到,短期的未来更加受限于当下的已知事实,长远的未来更需要的是“待价而沽”。将这些观察与我们知道的刺猬对模糊性的厌恶相联系,能合理地推测:(a)刺猬更愿意规避长期预测的变化莫测,把自己理解的因果关系强加于概念秩序;(b)拥有相关主题知识,尤其在认知上提出引人入胜的因果论证的专家,把论证强加于广受欢迎的秩序。现在我们应该预期一个“认知方式×专家知识×时间”的二阶交互作用:在达到认知闭合方面,我们将能力和意愿认知闭合结合在一起时,我们得到如下预测:刺猬式的专家最有可能拥有和建立现实的因果模式,并且在他们的长期预测上过于相信这种模式。
对认知过程解释的最后的挑战锁定在第四块拼图:解释为何在极端派间表现差距进一步扩大。实验研究已经表明,当观察者持有强烈的相关态度(以前的)时,有强烈闭合需求(刺猬式专家)的观察者最有可能依靠他们的先入之见解释新形势。[14]这些结果使我们有理由期待一个三阶交互作用:在预测者拥有充足的专业知识能够进行高深的论证(刺激信心)和预测者做出长期预测时(将对过度自信潜在的尴尬的现实检验推及到遥远的未来),刺猬方式和极端的信念的结合应该是一个特殊的强有力的信心驱动,与之伴随的是削弱校准和鉴别的最大潜能。
认知过程解释现在已经准备好解释观察到的预测准确性的效果。但是它能够解释预测者所犯错误的具体类型吗?我们仍需要对预测的准确性进行分解。我们不知道,刺猬更多的错误是全面而混乱地散布的,还是他们采取了某种与众不同的形式:对于变坏或变好预测不足或预测过度。
为了回答这些问题,技术附录向我们展示了需要与校准和鉴别的平方差公式不同的指标,它保留了误差方向的信息。这些方向性的指标揭示,尽管狐狸和刺猬都过度预测了变化(更低的基准率结果)——这样必然会对维持现状预测不足,而且刺猬犯这种错误的程度要比狐狸严重——但相比于狐狸,刺猬赋予变坏(平均主观概率,0.37对0.29;平均客观频率=0.23)和变好(平均主观概率,0.34对0.30;平均客观频率=0.28)太高的概率值,而赋予维持现状太低的概率值(0.29对0.41;平均客观频率=0.49)。此外,我们可以指出,预测过度的结果不仅仅是一个向均值回归的统计假象。一系列的t检验展现出在平均主观概率和客观频率之间的差距对刺猬(在0.001水平)和狐狸(在0.05水平)来说都是统计显著的。而刺猬的差距始终显著大于狐狸的差距(在0.01水平)。
然而,这些不对称表明,对于刺猬来说,还是有一些潜能可以弥合这种差距,譬如,运用“我犯了正确的错误”的辩护(我们将在第6章中详谈)进行分值调整。但现在必须充分地注意到,刺猬赋予低频率结果以太高的概率值都与已出现认知过程的数据恰好符合。我们发现这种符合的程度发生在我们探讨预测准确性(或者是合计的或者是分解为预测不足和预测过度的类型)和思维过程(我们要求预测者解释他们的预测时所做的汇报)之间的联系时。
我们两次(一次在他们的专业领域内,一次在他们的专业领域外)询问所有的参与者:“总的说来,为什么你对x的未来的评估是乐观的、悲观的,或者喜忧参半的?”我们对作为结果的思维规程的分析直指思维方式的两个特质:如果认知过程解释是正确的,那么应该能把狐狸和刺猬区分开来,并“解释”他们不同的预测表现。主要目标如下:
a.评估区分指数(evaluative differentiation index),它深入探测人们使用限定性的连词的频率,比如“然而”(however)、“但是”(but)等,暗示了思维间的紧张状态。
b.概念整合指数(conceptual integration index),它探测的是,为解决差异化的认知间的紧张关系(例如,权衡取舍后再做决断或者直接承认,明智的人,只要不是傻瓜和无赖,解决此问题时,能够用不同的思维方式看待同样的问题),人们多大程度上力求详细说明指导的原则。
方法论附录提供了编码的细节,以及将两种方法结合为一个综合复杂性指数的基本原理。[15]
我们对预测者论证的分析强化了刺猬—狐狸式结果的认知过程的解释,体现在以下几方面:
a.正如人们所预期的,如果狐狸和刺猬在知识上差不多,但对失调的容忍度和产生整合的动机不同时,我们就会发现:(1)刺猬和狐狸在他们所产生的思维的总量上没有差异;(2)他们的差异体现在评估区分和认知整合上,随着我们从受访者中四分位的“完全的”刺猬转向四分位的“完全的”狐狸,两个方面中每一个都升高了。复合过程测量——整合复杂性——与刺猬—狐狸式测量有0.38的相关性。
b.正如人们所预期的,如果这些在思维方式上的差异不仅与刺猬—狐狸测量有关,而且与预测技巧有关,那么整合复杂性与总准确度指标就会相关,比如校准(0.32)和鉴别(0.24),还有过度预测变化趋势的方向指标(0.33)。
c.正如人们所预期的,如果这些思维方式的差异一定程度上调和了更似狐狸的认知方式和预测技巧间的联系,那么在我们控制了这些测量和整合复杂性的重叠部分后(尽管偏相关性仍然很大),刺猬—狐狸测量之间,以及校准和变化的预测过度间的相关性就会暴跌。
d.正如人们所预期的,如果在刺猬式的推理方式和意识形态上的极端主义之间有密切关系,那么刺猬更可能成为极端派(在信念体系的三个内容量表上平均r=0.31)。与“这些密切关系深植于刺猬对不同观念的结合的讨厌,以及狐狸的容忍”的观点相一致,极端派也具有更少的整合复杂性(r=0.32)。
e.正如人们所预期的,如果刺猬的表现被有极端信念的预测者作出的远离基准率的极端预测所拖累,那么他们更倾向于以主观概率尺度上的高度信心为目标。相比于狐狸式的人,刺猬显著地认为更多的事情不可能或基本不可能发生(31.9%的判断对24.3%),以及更多的事情确定或高度可能发生(7.4%的判断对4.0%)。在所有的子群中刺猬式的极端派最倾向于用以下终点值:34%的事情不可能或几乎不可能发生,9.4%的事情确定或几乎确定发生。为了评估表现拖累的幅度,刺猬不仅更频繁地用极端点,当他们预测的时候,他们也有更高的失误率(“不可能”或“几乎不可能”在19.8%的时间内发生了,相比来说,狐狸式的人有9.9%的比率)和更高的错误报告率(确定的事或几乎确定的事在31.5%的时间内没有发生,相比来说,狐狸式的人有20.8%的比率)。
f.最后,有些人可能重提“狐狸只是懦夫”的假设(当狐狸在鉴别上战胜刺猬时,试图借此假设予以反击)。很显然刺猬做了更加大胆的预测——一旦发生意想不到的事这种预测将会非常尴尬。但是证据再次与“在狐狸间更多的谨慎源于对形势的均衡性的认知评价,而不是盲目执著于量表上的中间点”的观点相一致。刺猬—狐狸在预测端点的差别一度是显著的(r=0.35),但当我们控制住“与刺猬相比,狐狸更多地运用整合复杂性思考问题”这个事实的时候,两者之间的差别显著缩小(偏相关系数r=0.14)。如果一个人思考时受制于大量的“但是”(buts)和“然而”(howevers),那么很难为极端的预测聚集大量的能量。
总的来说,这些量化分析与好预测判断方面的描绘惊人地一致。图3—5展示了一种概念模型,它抓住了主要建构的关系模式。好判断者往往是温和的狐狸:这些人是折中的思考者,他们可以容忍对抗的观点,倾向于对他们的概率投注模糊措辞,而且并不远离事件的“只是猜测”概率和基准率概率。然而,在现实环境中狐狸怎样如此规律性地胜过刺猬,量化分析只是给了我们一幅模糊的画面。为了更好地理解究竟发生了什么,我们需要透过数字,比较在特定领域内刺猬和狐狸的推理策略,追踪这些策略与预测胜利、惨败之间的联系。[16]
图3—5
狐狸在预测技巧方面的优势可以追溯到两基点的中介:自由流动思维的更高的整合复杂性和赋值主观概率时谨慎的做法。这两种中介,依次可以追溯到更广泛的个体认知方式(狐狸—刺猬式量表)的差异和意识形态极端主义(三种信念内容量表上的得分)。认知方式和意识形态的极端性相互影响:狐狸式的推理方式会鼓励在意识形态方面采取温和的态度,而意识形态的极端主义会鼓励采取刺猬式的推理方式。