军备竞赛与合作

2026年04月02日

版权

军备竞赛与合作

乔治·唐斯　戴维·罗克　伦道夫·西韦森⁽¹⁾

一、导言

一个政府如果有意降低与对手的军备竞争水平，它可以采用多种方式实现这一目标。它可以选择把军费开支从进攻性武器转向防御性武器，期望通过增加自身安全而不降低对手安全的方式解决“安全困境”。它可以宣布今后在防务开支上与对手保持同一水平，以此使对手相信增加军备开支是徒劳的。或者它可以提议两国启动正式的军备对话。这些行动中的每一个都代表着旨在促进合作的一种不同类型的战略。把军费开支转用于防御性武器，是一种典型的单边战略，杰维斯对此已有详尽的论述。¹使本国的防务开支与对手的防务开支持平，是回报战略中默示讨价还价的范例；在谢林和在阿克塞尔罗德最近研究囚徒困境的著作里²，这种战略发挥着关键性的作用。正式的军备对话是多种谈判战略的组合。³

在本章中，我们将一一探究这些降低军备竞赛强度的战略的优势与弱点，这些战略由不同的偏好模式推动，因不同的不确定性来源而复杂化。本章含有大量的形式化与历史分析。仅使用形式化分析将有可能遮蔽如下事实：促使军备竞赛发生的条件组合范围远远大于根据狭隘的博弈论表述所预测出来的，军备竞赛受到形式化分析中通常不会考虑的因素的影响。例如，当国家运用“讨价还价筹码”战略或试图使对手认为本国比实际情况更强大，以便在其他政策领域取得政策优势时（如20世纪50年代后期的苏联所为），军备竞赛也许会发展或加速，尽管报偿结构显示发生的应该是合作。而且，我们将会发现，有可能提出这样一项战略：在信息完美与控制良好的世界里成功地推动合作，而在国家互动的不确定世界里却一败涂地。

这种方法，即试图仅通过分析19世纪和20世纪的历史记录来评估替代性的合作战略，仍面临着更为重大的问题。正如人们所设想的，这并不完全是因为军备竞赛被和平扭转的事例相对较少。尽管这类事例的数量还不够多，以至于无法在几个战略被同时执行的情况下把某个战略的作用分离出来，但是它们的数字仍要多于悲观主义者所想象的数目。⁴主要的困难反而存在于如下令人不安的事实中：大多数的军备竞赛以合作结束。之所以如此，不是因为一方采用一个特定的合作战略，而是因为与之无直接联系的事件改变了竞赛的基本性质。

此类事件，通常被统称为“木板的倾斜”（tilt of the board），它们大多产生于进行军备竞赛的两国关系之外的更大的经济环境和政治秩序的变化。可以被划到这一标题下的合作的最重要决定性因素是第三方强国的活动。回顾一下19世纪后半叶发生的一系列英法海军竞赛。1852—1853年的竞赛被“和平”地解决了，当时两国携手在克里米亚战争中与俄国作战；当拿破仑三世把他的注意力和有限资源用来对付墨西哥和力量上升的普鲁士时，1859—1861年的军备竞赛逐渐烟消云散；而1884—1904年的军备竞赛终结于德国力量和野心的增长。⁵尽管这些军备竞赛以竞争对手没有走向战争（至少是双方间的）而告一段落，但在对促进合作的替代性战略的效力做出判断时，它们都不是可以援引的理想案例。在解决过去的军备竞赛时，合作战略发挥的作用相对较小，这限制了我们直接评估该战略优势的能力。但幸运的是，这并不意味着使用历史分析毫无斩获。我们将会发现，通过界定容易被忽略的变量，通过激发关于理论上导致军备竞赛的众多“博弈”中哪一个被实际采用的思索，历史分析能够极大地丰富对军备竞赛的形式化分析。

二、军备竞赛、完美信息与合作

在开始理解三个战略的优势和它们必须应对的军备竞赛中的重要变化之前，考虑复杂程度最低的抽象模型会有所帮助：对抗双方寻求效用的最大化，对彼此的偏好和行为有着完美信息。我们可以把一个军备竞赛视为一系列的2×2博弈，这些博弈具有如表1所显示的标准报偿结构。⁶为了理解军备竞赛继续下去所必需的支付条件，可以考虑一下参与者之一的报偿情况。⁷在这种全信息的背景下，军备竞赛——本文中定义为持续的相互背叛——在理性的对手间不能继续下去，除非DD＞CD；否则对背叛的反应将会是合作。⁸如果对双方参与者来说这一要求都被满足，我们可以说这一博弈是稳定背叛型，即一旦其中一方背叛，此后双方都会背叛。理性对手间的军备竞赛的第二个要求是CC＞DC和CC＞DD不能同时为真。如果CC＞DC，合作优于单边背叛，就没有从相互合作中进行背叛的动机（一个被描述为合作稳定性的条件）；如果CC＞DD，这一稳定的结果比相互背叛更可取。⁹

图1　军备竞赛的2×2表述

下面的适用于每一方的9个结果序列满足上述条件：¹⁰

1．DD＞CC＞CD＞DC

2．DC＞CC＞DD＞CD　　　　（囚徒困境）

3．DD＞CC＞DC＞CD

4．DD＞CD＞CC＞DC

5．DC＞DD＞CC＞CD　　　　（僵局）

6．DD＞DC＞CC＞CD　　　　（僵局类型）

7．DD＞CD＞DC＞CC

8．DC＞DD＞CD＞CC　　　　（僵局类型）

9．DD＞DC＞CD＞CC　　　　（僵局类型）

1．僵局

这些序列中有4个与僵局博弈相关，因为就其所反映的那一方的偏好而言，最受青睐的两个结果都是背叛。因为僵局中几乎没有机会产生合作，因为一个如此坚定的对背叛的偏好似乎使战争无法避免，所以对社会科学家来说，一个持续的趋势显示僵局只能是对一小部分异常情况的描述（例如，希特勒统治下的德国）。一些理由表明这种关于僵局的预言式观点是幼稚的。与刘易斯·理查森（Lewis F.Richardson）¹¹以及其他人的理论相反，没有令人信服的证据表明，军备持续增加的年代大都必然走向战争。¹²它们也许会维持一种令人不安的、但却是大体和平的、动态的均衡，或者某些外部冲击使其以和平告终，后一种情况更加普遍。更重要的是，僵局和僵局类型的偏好也许是那些根本就没有希特勒帝国梦想的决策者的特点。例如，考虑一下这种情况：内部选民迫切要求增加军费开支以便提高军事工业的福利。如果在决定防务开支时，这种内部成分有足够重大的分量，决策者的偏好就将是对僵局的偏好：他们将不顾竞争国的行动而选择背叛。在这样一种情况下，他们的偏好就是对僵局的偏好——不是因为对战争的永不满足的渴望，而是因为他们非常重视特定的国内选民群体。

这并不是僵局偏好可能出现的唯一情形。如果一个政府认为它的武器系统优于竞争对手，或是它指导运用武器系统的战略优于竞争对手，它也许选择相互背叛而不是相互合作。它是否会这样做取决于（至少基于我们对理性的假定）哪一种选择能够产生最大的净收益。一些证据显示，第一次世界大战前，德国人对他们无畏舰和海军优越性的信心导致了这样一种认知：应选择与英国相同的造船投入而不是相互合作。这种信心可能被另外一种效用计算所强化，这种计算似乎在很多军备竞赛中发挥了关键作用：相对力量的计算。如果A国有10辆坦克，B国有50辆坦克，A国获得5辆坦克的决策使它的总体力量增长50%，使它与B国的力量之比增至30%。如果B国也选择同样的增长，A国与B国的相对力量之比仍增至27%。于是对A国来说，这种相互背叛与单边背叛差不多，可能好于相互合作。这种事态逻辑构成了1899年后形成的提尔皮茨德国海军政策的支柱，它在界定20世纪30年代德国和50年代苏联对僵局类型的偏好时发挥了作用。二者都以这样一种处境为起点，即与它们的天然对手相比，它们的力量是如此弱小，以至于通过相互背叛改善自己的状况是一种合理的预期。

最后，僵局或僵局类型偏好的出现，可能有助于解释那些与19世纪和20世纪军备竞赛中合作的演化有关的、最引人注目的发现：结束军备竞赛的国家战略相对稀缺、外源性事件具有重要作用。除了假定国家的偏好是不顾对手所为而武装自己，是否还有一种更容易的方法解释国家为什么会如此罕见地运用我们的三大战略之一来推动合作？同暗示参与者没有这样做的其他动力相比，是否还有一种更简单的方法解释外部因素为什么会在结束军备竞赛中发挥了关键作用？尽管有其他的解释来说明这两个发现，但它们的联袂出现意味着这样一种可能性：在实践中，僵局远比通常所认为的更加普遍。

现在让我们一一考察这三种应对“僵局驱动型军备竞赛”的合作战略的能力。我们从单边战略开始，单边战略增加了合作的潜力，而且不要求对手任何积极的参与或同意。它通过如下方式做到这一点：使一个国家得到通常从武器中获得的安全收益，但不会招致对手增加军备，因而也不会促使军备竞赛强度的增加。¹³同其他更加正式的合作性安排相比，例如双边冻结，一个单边战略具备的优势是使发起国的处境更好（在获得安全的意义上）。

至少有四种单边战略可以削减军备竞赛的强度。第一个单边战略（受到理论关注最多的一个）是集中关注抵制进攻性武器的防御性武器。¹⁴近来有人提议加固发射井，使用机动发射平台，或是发展发射井防御型的反弹道导弹系统，来增加洲际弹道导弹的抗毁性以抵御先发制人的攻击，而不是简单地通过增加洲际弹道导弹的数量和精确性达到这一目的。这些提议被证明为是正当的，至少都是部分地基于如下理由：这些措施将使美国更加安全，同时不会挑起新一轮军备升级。¹⁵让人好奇的是，历史上似乎极少有防御性武器因具备缓和军备竞赛的能力而被获取的事例。在军备竞赛期间，国家通常选择打造防御性武器而不是进攻性武器，但是他们这样做是因为他们认为，就一定的军费开支而言，此类武器提供最大限度的安全，而不是因为他们认为此类武器能够终结军备竞赛。因而，在1859—1861年的英法海军竞赛中，英国采用了建造警戒哨舰和强化海岸防御的政策，毫不考虑法国将怎样回应此举和此举会对军备竞赛有何影响。¹⁶同完全依靠战列舰相比，这些举措似乎提供了更大的安全。二战前英国针对德国发展轰炸机而采取的防御性回应，同样具有缺乏任何单边战略逻辑的特点。英国选择建造战斗机、雷达和高射炮而不是轰炸机——不是因为他们担心激怒德国以更大规模生产轰炸机，而是因为他们认为这是与德国人竞争的最佳方法。¹⁷

能够被用来摆脱安全困境的第二种类型的单边战略是防御性联盟的形成。在最纯粹的情况下，这些联盟发挥作用的方式与防御性武器完全相同。唯一的区别是，在这种情况下，防御性武器是通过形成联盟而被“购买”，不是被直接购买，从而允许国家提高或维持它们的安全水平并且无需致力于增加武器所需的预算支出。然而，与进攻性武器向防御性武器转变的情况相似，防御性联盟的事例虽多，但是可以断言，几乎没有防御性联盟是作为解决安全困境的战略的一部分而被构建的。当法国与俄国在1894年结成联盟时，它们都清楚地认识到它们的防御力量得到了极大的提高；但是它们认为联盟并不会使大英帝国（或德国）不受打扰——事实上联盟也不能。俾斯麦欧洲的特点是拜占庭式防御性联盟，这种联盟似乎已经更为成功地阻止了军备竞赛的延续；但同样无法明确这是否是行为主体的首要意图。¹⁸

单边战略的第三种类型是建立缓冲区国家。从理想状态来看，这一战略使双方同时享有更大的安全。1832年，一个中立并且独立的比利时的建立，就是一个很好的例子，尽管当时的动机与其说是缓和一个持续中的军备竞赛，还不如说是避免一个军备竞赛。¹⁹

单边战略的第四种类型是以情报信息的获得和坦白为基础。美国获得的关于苏联武器发展的信息越精确，获得速度越快，对苏联来说，偷偷摸摸地升级军备竞赛的成本就越大。为使敌国确信其最严重的忧虑是没有道理的，从而自愿给敌国提供情报信息的情形虽然很少见，但发生过。1853年，法国海军大臣邀请英国国会成员参观法国造船厂，以消除英国对法国大规模发展海军力量的猜疑。²⁰

因为僵局不能产生合作的动力，所以在这样一种环境中各种单边战略似乎与降低军备竞赛强度的问题毫无关系。国家不会在僵局之下为促进合作而选择单边战略，从这一意义上来说，这种不相关是正确的，但是国家会由于其他具有相似效果的动机而选择这么做。例如，假定一个国家目前偏好背叛的背后动机是对更大安全的渴望。如果一个国家认为，从扩大防御武器开支获得的额外安全净收益大于从合作与维持现状中所得，那么它也许会采取具有僵局特点的偏好，但却表现得好像它采用了一个单边战略。正如我们上面所指出的，这似乎是英国建造防御阵地和警戒哨舰的个案中已发生的事。这种行为与实施单边战略相类似，但是动机却是僵局：英国选择建造防御阵地和船只而不是与法国合作。这似乎也描述出了里根政府各类成员对待反弹道导弹的逻辑。也就是说，他们似乎倾向于构建一个反弹道导弹体系，而不考虑苏联是否会增加其洲际弹道导弹的数量和精确度，因为他们认为与一个核冻结体系相比，这样一个体系将会使美国的处境更好。在与此相似的情况中，动机是安全而不是合作，但结果相同。英国周边防御体系或美国反弹道导弹体系的成功运作，削减了法国大规模造船或苏联大量生产洲际弹道导弹的边际收益。如果法国和苏联的首要动机也是出于安全考虑而不是渴望扩大影响对手的能力，这些行动就能够减缓各自的军备竞赛。²¹

默示讨价还价不同于单边战略，因为它所采取的行动取决于另一个国家的行动；也不同于常规谈判，因为言辞交流的作用相对微不足道，并且没有达成正式协议的企图。也许与之最相似的是行为矫正中使用的强化日程表，即以他或她最终“学会”理想行为的方式来奖励和惩罚矫正对象。当然，这里的每一个国家都同时具有“矫正对象”和“实验者”的双重身份。默示讨价还价与僵局驱动型军备竞赛不相关，因为两个国家都没有停止背叛和发送积极信号的动机，或没有关注这样一个信号是否被发送的动机。

谈判与默示讨价还价相似，似乎也不担负降低僵局驱动型军备竞赛强度的许诺。如果相互背叛比相互合作更可取，为什么要去谈判？答案存在于这样的事实之中：当两国在一个特定的博弈范围内（例如，导弹博弈、无畏舰博弈等等）都选择背叛而非合作时，谈判提供了将此博弈与其他议题（例如，获得原材料、对领土权利的承认）以这样一种方式联系起来的可能性，即双方在更大博弈的合作中获得的净边际收益大于从背叛中所得。用更正式的用语表述，即附加议题的出现将一个基本上无达成协议余地的零和分配性博弈，转化成一个双方可以同时受益的非零和一体化博弈。²²

诀窍在于，无论是什么样的物品或政策，在谈判之前都不能被自由交换。如果双方已经直接以最佳水平进行了物品或政策的交换，引进防务议题将毫无所获。物品和政策必须以这样的方式与防务议题相联系：即如果不能通过谈判达成军备协议，就不会有最佳水平的交换。这些在大多数军备竞赛中不难发现。美国和其他国家经常限制与军备竞赛对手之间的原材料、燃油产品和各种制成品的贸易。其中任何一个都可能成为谈判结束僵局型军备竞赛的基础。

处于次优交换状态的商品和政策在结束僵局型军备竞赛时所发挥的作用表明，一个在与对手的交流上施加种种经济和社会限制的领导人，将比一个没有施加此类限制的领导人，更有能力通过谈判结束僵局型军备竞赛。这也许有助于解释为什么以相互间怀有极大敌意而著称的领导人，通常能够通过谈判在他们那些更为温和的同事失败的地方实现和解。原因并不完全是因为大家通常所认为的那样，即他们处于一个能够把他们的保守主义追随者和自由主义反对者整合起来的位置上，而且还因为他们已经非常彻底地把其他议题与军备竞赛联系起来，以至于他们可以给对方提供更多的合作回报。

2．囚徒困境

每一个合作战略在处理囚徒困境引起的军备竞赛时都是有效的。而且，因为相互合作在囚徒困境中比相互背叛更有吸引力，存在着使用这些战略的动机。在完美信息囚徒困境的背景中，单边战略有两个问题。一个存在于暗含的假定之中，即假定对手的首要动机是安全动机。如果这一假定是正确的，那么竞争国就没有动机对发起国获得防御性武器、防御性联盟等做出回应，因为与这一行动发生之前相比，该国并不会感受到更多的威胁。另一方面，如果竞争国的动机是对另一国的政策施加影响，那么针对防御性武器的发展或防御性联盟，它采取的回应方式，将会与回应进攻性武器发展或进攻性联盟建立的方式大体相同（在努力方面，如果不是技术方面的话）。

单边战略的另一个问题是假定存在一个对发展进攻性武器的有利的替代性选择。然而，这通常是完全不可得的，或决策者认为是不可得的。如同没有洲际弹道导弹的真实替代选择一样，在潜艇开发之前也没有获取主力舰的防御性替代性选择。与此相似——尽管有人可能认为这是一个认知问题——在第一次世界大战前夕，针对他国的扩军行动，国家领导人发现除以本国扩军相回应之外没有其他实际的替代性选择。

近来阿克塞尔罗德以一种非常有趣的方式探究了囚徒困境背景下作为替代性选择的默示讨价还价战略的优点。²³在一个重复囚徒困境的计算机模拟中，他发现回报政策——或“一报还一报”——以合作开始而后根据对手行为做出反应，在与许多战略的竞争中取得了最佳战果。这一战略是有效的，不仅因为它把博弈与其他议题相联系，而且因为它在当下行为与同一博弈在未来的重复之间建立了链接。在单轮囚徒困境博弈中，博弈双方都会选择“背叛”战略，因为无论另外一方做出何种选择，该战略都会使每一方的个体利益最大化。然而，在同一博弈的次数巨大且未知的多轮版本中，情况通常并非如此。背叛在任何一个单轮博弈中带来的好处将被预期所压倒，即这样一个决定将招致对手在随后的博弈中以背叛相回应。这可能造成重大损失，因为如果相互背叛被叠加的巨大次数代表着此博弈在未来可能的发生次数，那么对照相互合作与相互背叛之间的差异，从单轮背叛所得的收益是相当有限的。阿克塞尔罗德指出这可以解释为什么公司只是偶尔违背它们之间的合同，即使是在法律追索权不能实现的环境中。与后来的彼此间交易实现的收益相比，任何单次违反合同所得的收益都是不重要的。

重复的前景在军备决策中发挥着关键作用，因为总是有这样的可能性，即任何速度的军备增加或技术创新都将激起新一轮的军备竞赛或强化已有的军备竞赛。当其他条件相同时，在一个囚徒困境的军备博弈中，预期重复的次数越多，将越可能做出如下判断：军备领先的短期收益小于旷日持久的军备竞赛的长期成本。一个对推动合作感兴趣的政府可以对这一事实加以利用，即使竞争对手确信如下的情况：对于任何军备升级，它都将通过增加自己军备的方式做出咄咄逼人的回应，任何时候它都有资源如此行事。这与英国在19世纪若干关键历史时刻所采取的官方政策非常接近，也许其中最明确的就是英国政府所宣布的“两强标准”：英国的海军力量至少与居于英国之后的两个最大舰队的力量之和旗鼓相当。重复推动合作的力量可以见诸于军备协议对武器的关注倾向，军备协议重点关注那些将使持续重复的代价极其高昂的武器（例如，无畏舰而非驱逐舰）和那些新的、未经证实的武器系统，这些武器系统只能给“领先”国家带来有限的短期收益，但同时预示着成本在未来的极大增加（例如，反弹道导弹、太空武器）。

情报力量的发展有一个有趣但被广为忽视的方面：在双方力量差异具有重大战略性意义之前，通过允许一个国家有机会赶上另一个国家，情报力量的提高削弱了军备增加与创新所带来的短期优势，而且通过为许多及时的回应提供机会，情报能力的提高进一步增加了可重复性。我们将会发现，在默示讨价还价战略的执行中，这一点大有裨益。

当然，在安全事务上，决策者并不总是能够使他们自己确信，更不用说对手，合作的长期收益大于背叛的短期收益。正如范·埃弗拉所明确的，第一次世界大战之前对进攻的狂热崇拜创造出了一种氛围，在此氛围中每一个政府都相信轻微的兵力或武器优势能很快转化成军事上的胜利。²⁴在这样一种环境下，合作的长期收益（阿克塞尔罗德称之为“未来的影响”）在胜利的收益或失败的成本面前黯然失色，未来不合作的威胁也变得无关紧要。显然，与之相同的观点被用来证明核军备竞赛中合作缺位的合理性。也许，这并不令人感到惊讶，似乎在过去200年间很少有这样的军备竞赛，如果有的话，其中一方或双方政府官员的说词中没有处处充斥着如下警告：在与对手的军备增长的较量中，任何延误都将导致满盘皆输。例如，在19世纪，当第一艘法国装甲舰诞生的消息唤起了英国人的恐惧时，即法国人通过“铁桥”跨越英吉利海峡的入侵迫在眉睫，未来军备竞赛的成本只给大英帝国投下了一小片阴影。²⁵

如同处在僵局情况中，在应对囚徒困境引发的军备竞赛的谈判中，关键的谈判能力是通过建立与其他博弈和议题的链接来改造博弈的能力（或至少降低背叛的相对收益）。有时当单边背叛对相互合作（DC—CC）的优势较小但相互合作对相互背叛（CC—DD）的优势较大时，这种链接可能是谨慎的和内隐的。如果国家A违背了协议，国家B将会退回到背叛中去（如同默示讨价还价的情况），或是拒绝在能够实现共同利益的其他议题上进行谈判。在其他一些时候，这种链接也许被塑造得更加正式。无论是哪一种情况，当背叛发生时，必须有能力撤出被链接的博弈或议题，否则就没有继续合作的动机。

虽然运用单边战略或默示讨价还价使军备竞赛部分降级的历史事例难以寻觅，但谈判在设置中发挥了重要作用，参与方看似可被认为具有囚徒困境偏好的事例似乎有三个。这三个事例是1922年的《华盛顿海军条约》、《美苏第一阶段限制进攻性战略武器条约》和《美苏第二阶段限制进攻性战略武器条约》。1922年的《华盛顿海军条约》给当时的三大海上强国——英国、美国和日本的战舰建造努力设置了界限。为了评估谈判的作用，我们需要了解产生了主力舰吨位比例为5∶5∶3的妥协协议是怎样的复杂，需要了解在什么样的程度上有必要引入除军舰建造之外的议题。第一个问题的答案是该协议包括许多与军舰建造无关的太平洋安全与贸易问题。²⁶英国和美国得到了如下保证：中国和太平洋地区的贸易实行门户开放政策，山东省和主要交通体系归还中国。它们也得到了如下保证：除一些具体规定的例外，日本将不会增加第一次世界大战中从德国手里夺取的太平洋岛屿上的防御工事。后一条款对美国来说尤为重要，因为美国发现如果太平洋遍布日本海军基地，美国的控制地区如菲律宾和关岛事实上是无法防御的。这两组保证对英国来说也是重要的，英国因此无须在太平洋地区维持一支庞大的海军。此外，《华盛顿条约》给英国提供了一个可以不去延长即将到期的、可能是错综复杂的1902年英日同盟的理由。对日本来说，它得到了管理从德国手中取得的赤道以北领地的法律权利，并且能够阻断英国和美国达成太平洋地区互助协议的可能性。

如果缺乏这些协议，主力舰协议就无法被签署。没有中国问题的解决，英国无法做到减少其在太平洋地区的存在。美国，尽管可能是最少执著于将战舰作为海军核心的大国，但也处于建造更多此类舰船的过程中（参见1916年国防法案和1919年国防拨款法案）；如果对于防御美国在太平洋的领地和东方的自由贸易来说是必需的，美国也许会进一步增加它们的数量。日本只是近来才再次确认他们对“两个中队且每队8艘战舰”的政策承诺，如果面对一个英美防御协定（没有《华盛顿条约》时的可能结果）和美国继续坚持要日本放弃从德国得到的太平洋领地，日本几乎肯定会以更快的速度建造更多的舰船。²⁷十年之后国务卿史汀生在写给参议员博拉（Borah）的信中对此加以评论，表明了最终解决的多维性质的重要性：

也应该铭记的是，这一条约是华盛顿会议上各相关大国缔结的几个条约或协议中的一个，这些条约与协议都是相互联系、相互依赖的。漠视其中的任何一个条约，都会打乱普遍的谅解与平衡，这种谅解与平衡被设计为通过一组协议取得并受其影响，这组协议是作为一个整体达成的。华盛顿会议本质上是一场裁军会议，不仅通过停止海军军备竞赛，而且通过解决那些威胁世界尤其是远东和平的其他干扰问题，华盛顿会议致力于世界和平的可能性。²⁸

因而，在《华盛顿条约》的个案里，为达成协议，额外的维度被附加到主力舰问题上；效果复杂到足以举行必需的谈判。

在略逊一筹的程度上，《美苏第一阶段限制进攻性战略武器条约》具有相似的复杂性特点。它载有条文允许每一个国家在战略军械库的水平和“组合”上有重大的不同。即使是最基本的折中，即允许苏联在投掷重量领域拥有优势，同时允许美国保有数目更多的导弹，也是难以通过默示讨价还价实现的。《美苏第二阶段限制进攻性战略武器条约》更加复杂，引入了巡航导弹、苏联轰炸机和西欧前方基地的议题。例如，斯特罗布·塔尔博特（Strobe Talbott）叙述了如下交易：苏联接受了美国所偏好的配备1200枚多弹头分导载入飞行器弹头的最大上限，换取了美国接受苏联对2250件战略运载工具限制的偏好。²⁹

能够把不同武器系统和同一系统的不同方面联系起来，以及能够引进非武器因素如领地和贸易议题，是重要的，裁军对话的谈判各方手头没有如此选择的命运也证明了这种重要性。1899年的第一次海牙会议，议程以如下方式构建：谨慎地把武器限制对话与每一个其他议题的讨论分离开来；与会代表主要是军事专家，既无权威也无技能引入政治、经济或领土议题。如果认为这种情形有所不同海牙会议就会成功，无疑是不明智的，但如果说约束代表工作授权的狭隘性制造了一个结构控制问题，该问题使任何真正进展的取得几近不可能，则并非不切实际。³⁰

三、不确定性的来源：信息与控制的问题

军备竞赛实际发生时所处的决策环境提出了许多信息与控制的问题，这些问题扩展了可能导致军备竞赛的博弈范围，并影响任何特定战略产生合作的能力。这些问题与在公共财政领域发挥重要作用的不完全市场有些相似，因为它们都使决策问题复杂化——在这种情况下，是在军备竞赛中取得合作而不是将边际社会收益最大化——而且削减了纯粹的演绎分析的适用性。而且，就如同外部重要性、自然垄断和消费者无知更多地是由对真实市场的观察而不是由逻辑决定一样，对这些复杂特点的探索植根于真实军备竞赛的演变。首先我们将列举几个信息与控制的问题，并思考它们如何发挥作用来扩大可能导致军备竞赛的博弈范围。然后我们将展示它们如何使其他博弈的表现不同于其在完美信息假定下的进展。

1．战略误导

战略误导发生于如下的讨价还价情形之中：为了获得优势，一方伪装出实际上并不具有的偏好。在军备谈判的情境中，典型的情况是一国以超出实际期望的程度伪装渴望一个武器系统，试图以此迫使对手为停止该武器系统的开发而做出让步。不幸的是，这样的虚张声势有时会被人质疑，在这种情况下，保持未来可信性的意愿必然要求建设该系统的威胁被贯彻落实。这意味着在一些足够不幸的环境里，几乎任何博弈都会导致军备竞赛。谢林的反弹道导弹的经典案例提供了一个例证；另一个例证可以在与试验性导弹的关联中找到。可以认为，国会的大多数议员都相信这一点：即使没有苏联的约束，非机动的试验性导弹也是没有必要或不受欢迎的。在没有导弹作为讨价还价筹码促使苏联让步的情况下，看似合理的国会偏好模式是CC＞CD＞DC＞DD，在具有完全理性和完美信息的孤立博弈中，这是一种从不会导致军备竞赛的情况。然而，尽管如此，如果以导弹作为讨价还价筹码的做法未能达成目的，大量导弹必然要被建造。

另一个能够被置于战略误导标题之下的、与军备竞赛有关的重要行为，是对能力而非偏好的伪装。1957年秋，苏联宣布它通过一枚洲际弹道导弹把一颗卫星送入轨道。在此通告发表之后的数月里，通过频繁地公开展示数量有限的导弹、聪明的言辞及美国的无知的综合作用，赫鲁晓夫系统地误导（和夸大）了苏联反弹道导弹的实际能力，苏联的此项能力与美国的并不接近。³¹随后他试图利用这种“导弹差距”来增加苏联在各种政策领域的影响。尽管他只取得了零星的胜利，但是他成功地使美国政府为它假定的战略弱点而惊恐。当然，在盖瑟委员会（Gaither Commission）的报告中可找到这种担忧的最重要证据，该报告建议以国防开支的大幅增加作为回应。艾森豪威尔总统对平衡预算的态度阻止了他完全采纳这些建议，但是他急剧地加速已有的反弹道导弹项目（和军备竞赛）——如果苏联人没有谎报他们的能力，他不会采取这一行动。

2．不完美情报

不完美情报能够激发一场完美信息时不会发生的军备竞赛，并且允许军备竞赛在未被“证明其正当性”时继续进行。理查德·科布登（Richard Cobden）和赫斯特（F.W.Hirst）都认为，在每一次英法海军竞赛中，英国都一贯地高估法国船只的生产速度和法国舰队的规模，他们用自己的建设项目加以回应，从而广泛地升级了任何可能真实存在的竞赛。³²事实上，至少有一个时刻有证据显示法国舰队的规模实际上在下降，而此时英国却确信他们处于一场军备竞赛中。³³与此相似，1875年德法之间也处于爆发一场小型军备竞赛的边缘，因为德国的情报显示法国正在大量购买骑兵所用的马匹。法国大使做出了大量的努力使德国政府确信它的信息是完全错误的。³⁴

近期，“最坏情况分析法”的采用——竞争者们建造武器以回应它们对手可能实现的最大增长——已经加剧了军备升级的速度。阿兰·斯托文（Alain Enthoven）和基思·史密斯（Keith Smith）在论述麦克纳马拉领导的五角大楼如何估算“多少才足够”的问题时，指出估算中列入了对苏联力量的假定；尽管那些力量被认为是不可能的，但是“因为这样的威胁是可以想象的并且在苏联的技术力量范围之内，所以那些力量在军队规划过程中被明确且系统地加以考虑。”³⁵假定敌军力量比其所显现的更为强大，这已是一种倾向。在证明空军战略立场的合理性时，柯蒂兹·勒梅（Curtis LeMay）将军为此种倾向提供了一个更为坦率的陈述：“我们必须拥有足够的军事力量去打击我们知道的他所拥有的全部目标或武器，而且我还希望能有少许缓冲来关照一些我们可能不知道的他所拥有的目标或武器。”³⁶

即使背叛并未真实发生，通过增加一方认为另一方已经背叛的可能性，不完美情报扩大了导致军备竞赛的博弈范围。如果我们保留如下要求：DD＞CD，所以一方的背叛（貌似的背叛）将导致另一方也背叛，另外三个博弈将成为军备竞赛的潜在来源。

10．CC＞DD＞DC＞CD

11．CC＞DC＞DD＞CD　　　　（猎鹿博弈）

12．CC＞DD＞CD＞DC

这三个博弈并没有被经常分析；在完全理性和完美信息之下，每一个应该无可避免地导致相互合作，因为双方都会观察到这一结果对其中的每一方和对集体都是最佳选择。而且，任何一方都没有背叛合作解的动机，从这一意义上讲，三个博弈都是稳定合作型的。

第一个和第三个双稳定博弈（10和12）不是非常有用的类型，因为这两个博弈要求一种不太可能发生的情况：一方优先选择相互背叛而不是在与对手合作时的单边背叛。然而，猎鹿博弈通常可以成为真实军备竞赛的一个准确模型。例如，它描绘了如下的经典情况：一国获得某种它自己不会主动去建造的武器，因为它认为对手正在建造这种武器。³⁷

3．解读问题

决策者的意识形态和他们在国际体系中的活动经历，不可避免地影响他们处理信息的方式以及他们对自己正致力于何种军备竞赛博弈的洞见。无论何时，只要无法确定行动的可能后果或是另一个国家行为的意义——几乎任何时候都会如此——这些因素在决定他们如何评估局势时就会发挥关键作用。意识形态影响不确定性之下的概率评估，其功能类似于先验分布。当然，难题是无法保证这种经历或意识形态引导的洞见是准确的。从对引发军备竞赛的博弈的影响来看，经历与意识形态的作用与信息匮乏的作用相同；全都创造了军备竞赛在猎鹿博弈中出现的可能性。

经历影响国家决策者对其所从事的军备竞赛的评估，并且强化他们加强军备竞赛的倾向，这样的事例大量存在。《华盛顿条约》阻止日本军备增加的最终失败，极大地影响了第二次世界大战刚结束时美国对军备控制的态度。国防部长福里斯特尔反对与苏联共享制造原子弹秘密的提议，很大程度上是因为他认为苏联人在心理上是亚洲人，因此，像日本人一样，无法相信其会遵守军备限制条约。³⁸国务卿贝尔纳斯的立场与之完全相同：“美国人抛弃了战舰，日本人抛弃了蓝图，美国不会再犯相同的错误。”³⁹

经历是解读问题的来源之一，但它不一定是最重要的那一个。意识形态是与之平分秋色的对手。例如，现有的证据显示，约翰·福斯特·杜勒斯的意识形态使他难以意识到苏联方面的合作行为。例如，1956年苏联宣布裁军120万人，在回答记者提问时，杜勒斯强调了苏联领导人缺乏诚信。与此相似，杜勒斯用“鬼把戏”来回应斯大林继任者显而易见的缓和姿态。⁴⁰杜勒斯对苏联这些具体行为的解读正确与否，并不重要。问题的关键是，杜勒斯的意识形态使苏联人难以传达他们主动终结军备竞赛中的某个部分的兴趣，如果他们的确渴望如此。在这一环境中，意识形态激发了认为对手已经背叛的判断，它与不完美情报执行了完全相同的功能，后者在对手实际上并没有“竞赛”时，显示对手在这么做。我们将会发现，解读问题所造成的困难在发出合作信号方面与接收合作信号方面一样多。

4．控制的问题

试图发出合作意愿信号的国家决策者无法达到该目的，原因是政府的其他部分没有回应其指令或意愿，每当此时，控制问题就有助于军备竞赛的延续。在古巴导弹危机的中期，肯尼迪总统意识到他先前所发出的命令并没有被执行，即撤走土耳其境内一定数量的过时的、易受攻击的（也许更为挑衅的）朱庇特导弹，随后他再次下达了立即撤出这些导弹的直接命令，但这就是控制问题：最初的结果只不过是对拒绝执行命令这种选择的测试。⁴¹苏联人怎么解读这一切？他们正在与一个试图帮他们在古巴导弹危机中保留颜面的政府打交道，抑或美国人打算挑衅？就此而言，他们会如何解读多年后参议院没有批准《美苏第二阶段限制进攻性战略武器条约》的行为？

控制问题超越了直接命令是否被执行这一简单议题。正如莫顿·霍尔珀林（Morton Halperi）所指出的，精心选择时机把消息泄露给媒体，能够极大地损害任何尚未赢得普遍支持的政策，仍处于进展之中的谈判经常被不合时宜的轻率之举破坏。⁴²也许正是这种认识促使国家领导人在军备谈判的关键时刻使用私人特使和首脑会议。传统的解读认为这是对常规交流渠道超载的适应性反应，但是这多多少少也能够被归因为认识到赌注太高以至于不能冒失控的风险。

不确定性从几个方面使单边战略的适用复杂化。第一，如我们已经指出的，如果对手的动机更多地来自拓展自己权力的野心而不是安全考虑，那么第一个国家为获得更多安全感而采用的单边步骤，也许只会激发对手为施加自己影响而进行更大的努力。马其诺防线和英国战斗机部队都促使德国逐步扩大其武器生产和战术革新。政府的疑虑通常是对手的动机中安全需要要少于对更大政策影响力的渴望，这是他们极少运用单边战略促进合作的原因之一，对此无人存疑。

第二，一个具体的武器系统或联盟的基本性质通常是一个解读问题。1932年在日内瓦举行的世界裁军会议就是一个在解读上存有差异的事例。这次会议上，有人倡议进攻性武器应被宣布为非法，而防御性武器应被允许存在。派代表出席会议的国家都能够同意重型坦克显然是进攻性武器，但他们在每一件其他武器的性质上都产生了争议。例如，航空母舰被日本视为进攻性武器，但被美国视为防御性武器。⁴³20世纪30年代德国和法国政府对前线防御工事的不同解读中出现了类似的难题。截至1932年，法国人已经在马其诺防线投下了大量资金，对他们来说，前线防御工事是防御性的。然而，德国政府将马其诺防线背后的地区视为可以集结军队以攻击德国的地区。这一观点可能推动了齐格弗里德防线（Siegfried Line）上防御工事的建造，这些防御工事与马其诺防线上的那些防御工事针锋相对。⁴⁴

尽管许多联盟国家的原意是防御，但它们的潜在对手不一定如此看待。1904年，作为一种稳定英法在棘手政策区域关系的方法，《英法协约》被建立。而到1905年时，德国人将该联盟视为威胁德国人利益的设计，其中最显著的是德国人在摩洛哥的商业利益。⁴⁵

在对单边战略成功的影响上，其他几个复杂因素的作用小于解读的作用，但往往与解读互动。情报信息的质量具有显而易见的重要性。一个政府在本国武器性质的问题上越是开放，其他国家的回应被最坏情况设想所主宰的可能性就越小。如果采用单边战略以缓和军备竞赛，有一点非常重要，即应使另一方确信任何反弹道导弹系统仅是用作发射井防御，或者在导弹发射井进行的工作仅是意图加固发射井，而不是在安装导弹的多个弹头。

在探索信息与控制问题对默示讨价还价战略的影响之前，如同用“一报还一报”所显示的，区分回报的两类优点是有益之举，即回报作为进化战略的优点和回报作为终结单轮军备竞赛或减少其强度的战略的优点。作为一种进化战略，它潜在地适用于从单细胞生物到人类文明的每一件事物的长期发展，它从多次的成功或失败中得到力量。然而，作为一种终结一场具体军备竞赛的战略，它依赖于对它所造成的发展军备或不发展军备的可能后果的预期：以减少背叛的净收益，或者将博弈从囚徒困境类型转化为某种更为良性的类型。然而，并非出人意料的是，这些预期能够被我们这套复杂因素以这样一种方式影响，即“一报还一报”战略的效力被降低。应该指出在阿克塞尔罗德的实验中，贝叶斯惯例表现不佳；⁴⁶但是，至少有两个理由使得预期似乎仍对国家之间的默示讨价还价有极大的重要性。第一，一个国家所面对的另一个国家，如果同其面对的可能是被随意设计的计算机程序相比，是更为精确的先验存在。第二，与仅能使用过去背叛与合作序列的计算机程序相比，国家可以使用的各种信息在数量上要多得多。(https://www.daowen.com)

为了考察信息与控制问题在何种程度上削弱“一报还一报”战略的有效性，构建一个简单模型颇有助益。第一，考虑控制问题。因为已经论述过的原因，当决策者试图采取特定行动X，例如将导弹撤出土耳其，X会被正确落实的概率只有一个（设定为c）。第二个是信息流动的问题。由第一方发起的行动X能否被第二方准确察觉。例如，军事行动中被投入或撤出的导弹数目也许被竞争国高估或低估。第三，本意是合作（或背叛）的行动X也许并不会被另一国如是解读。当率先行动可能涉及大量的武器系统时，这一问题尤为关键。如果一方停止造船但加快了生产坦克的速度，或是放慢了建造导弹潜艇的步伐但略略加快了巡航导弹的生产，这将被理解为合作还是背叛？发起国能够确定这样的行为如何被解读吗？另一国能够确定这些行动的本来意图吗？

实践中这些问题也难以区分。当信息匮乏时，一方会以先前的互动为条件，严重依赖于先验的信仰去设想竞争对手的所作所为。因为这一原因——为防止目前的讨论变得过于复杂——我们在模型中将把信息问题和解读问题合在一起。如果对手已经采取了X行动，意图是合作，对手的X行动被认知并被解读为合作的概率设定为q₁。如果对手已经采取了Y行动，意图是背叛，对手的Y行动被准确认知的概率设定为q₂。在实践中，控制、信息和认知不是两分性的；它们分布在一个连续体上并呈现出许多种差别。背叛与合作不是二元选择。但是，在简化模型中可以假定所有这些因素都是两分性的，这样做颇为实用，因为这么做可以排除很多不必要的复杂情况。

看看分析在这些因素面前会变得如何的复杂，是一件有趣的事。假定国家A决定合作。如果行动被正确执行（概率为c的事件），合作被认知的概率为q₁。如果行动没有被正确执行（可能性为1－c的事件），合作被认知的概率为1-q₂。例如，如果国家A意图合作，国家B将其认知为合作的概率是表2右上方的数值。相似的计算得出表1其他条目的数值。

表1　信息与控制模型下被以各种方式理解的实际回应的概率

在该模型的传统、完整信息和完全控制版本中，参数c、q₁和q₂都等于1。如果每一方都以合作开始，然后在完美信息下采用“一报还一报”战略，结果总是CC。我们可以把这一点表述为四种状态CC、CD、DC、DD的概率向量（1.0，0.0，0.0，0.0）。但是，我们假定q₁=q₂=0.99。把误解概率设定为一个百分点（有种种迹象显示，困扰大多数军备竞赛的误解概率远远比这个数字高得多），在这个仅是稍稍现实了一点的假定之下，四种结果的长期概率是（0.25，0.25，0.25，0.25）。这意味着该博弈具有一种稳定性，即在75%的时间内至少有一方背叛。阿克塞尔罗德关于错误知觉变量的循环赛结果显示，它仍然优于其他被投入比赛的战略，但是那些其他战略是在完美信息的假定下被设计的。⁴⁷

不完美信息条件下“一报还一报”战略产生次优结果的一个原因是，在对手先前采取了显而易见的背叛行为后，每一方都准备得太好以至于不会背叛。在这种情况下，似乎需要一点更多的耐心。这一类战略的可能延展是概率性的“一报还一报”战略（probabilistic tit-for-tat），在这个战略里，对手采取合作之后，我们合作的概率为s，而背叛的概率为1-s；对手采取背叛之后，我们背叛或合作的概率分别为s和1-s。当对手表现为已背叛时，我们会以小于1的概率背叛，因而是略多耐心的。要观察这将如何发挥作用，让我们假定两国都拥有完美控制而且q₁=q₂=0.95。假定两个国家都决定以更加宽容的方式行事，把一次背叛仅仅当作部分时间内的一次背叛：它们表现得好像q₂小于0.95，例如是0.5。在这种情况之下，长期的概率向量为（0.83，0.08，0.08，0.01）。即使只有一个国家宽容行事，另一个国家仍旧执行“一报还一报”战略，结果仍是（0.74，0.10，0.14，0.02）。

阿克塞尔罗德建议，“一报还一报”战略中的报复概率应该小于1，以便减轻一轮背叛的后果，在完美信息与控制的“一报还一报”下，一轮背叛可能导致无休止的一轮又一轮的呼应或相互背叛。⁴⁸最明智的做法也许是将这一战术与概率性的“一报还一报”战略结合起来形成一种战略，该战略事实上是单位区间（区间内0=背叛且1=合作）内的概率分布，0与1之间的数字表示部分背叛。

不完美信息的上述后果在进化的意义上也是正确的。假定这样的条件，即q₁=q₂=0.95。在“一报还一报”战略（TFT）下，一国在第一回合会采取合作，此后将采取它所认为的对手在前一回合所采取的战略。修正的“一报还一报”战略（Modified Tit-for-Tat）（MTFT）与之相似，但更加宽容，例如表现得好像q₂=0.5。使用阿克塞尔罗德的支付矩阵，TFT对TFT的长期支付为2.25，TFT对MTFT的支付为2.94，MTFT对TFT的支付为2.74，MTFT对MTFT的支付为2.90。这意味着一个大数量的TFT群体能够被MTFT成功侵占，以至于TFT在不完美信息下没有集体稳定。当然，MTFT也是不稳定的；在均衡状态下和大数量群体中，相等的支付也可被得到，如果该群体中有82.5%的MTFT和7.5%的TFT。毫无疑问，存在着一个战略优于这些战略中的任何一个，但这仍是一个有待进一步研究的问题。

当然，一般来说，上述观点不应被理解为对默示讨价还价的指控。赫斯特高度评价了回报政策，认为它带来了19世纪英法之间最长时间的合作。⁴⁹此外，谢林也指出几个美苏之间军备限制事例的出现，明显是在默示讨价还价的基础上实现的。⁵⁰但是，默示讨价还价战略非常容易受到控制、信息和解读问题的影响，意识到这一点非常重要。在一个特定的背景下，最好的解决方式也许是使用修正的“一报还一报”战略，但是一个同等实用的替代选择也许仅仅是采用精心制定的措施，例如运用热线电话等，通过回避正常渠道，使控制与信息问题最小化。如果可以通过两种方法中的一种有效解决这些问题，在给囚徒困境或猎鹿博弈中的对手提供合作激励方面，默示讨价还价将被证明是极有价值的。

与运用单边行动战略和默示讨价还价战略的情况相比，谈判与信息、控制问题之间的关系更加不确定。部分原因是谈判的主要优势在于它处理上述削弱其他战略的信息问题的能力。美苏对投掷重量和导弹数量赋予不同价值的事实，或是德英对战舰数量和总重量赋予不同价值的事实，都能够对默示讨价还价战略造成极大的破坏，因为双方中没有哪一方能充分理解另一方把什么认定为回报。效用上的分歧可以构成许多解读问题的根源，但它恰恰是通过谈判达成协议可利用之处。

谈判中出现的战略误导偶尔会制造信息和解读问题，这些问题能够导致规模更为巨大的军备升级。在英国开始斡旋阿根廷和智利1894—1902年的海军竞赛之前，两国在断断续续的谈判中都运用了夸大自己权利要求和攻击性的方法，这种言过其实的要求和攻击性似乎激起了另一方更为强烈的敌意，因而加剧了军备竞赛。⁵¹而且，正如我们前面所提到的，运用讨价还价筹码战略，例如为了得到对方的让步，威胁建立一个全非本意所渴望的武器系统，可能会导致军备竞赛的强化，这是一种没有谈判则永远不会发生的强化。

谈判战略激励双方在尽可能强势的立场上讨价还价，这也能够强化军备竞赛。理查德·尼克松哲学的军备竞赛含义不难推断：任何国家在任何时候都不应该让它的总统作为世界第二强国的领导人，走向谈判桌。这些国家将通过军备竞赛升级的方式为和平对话做准备，如果对话破裂，可能认为必须要继续这一步伐。更为悖谬的是，每一方都会假定对方采取这一战略——这将进一步增加获取军备的速度。这与典型的讨价还价筹码战略不同，因为两国都在武装自己而不是威胁武装，单边行动或默示讨价还价不会受到这一问题的困扰。

四、结论

军备竞赛中蕴含的“博弈”和军备竞赛发生的背景条件，都能极大地影响任何试图终结军备竞赛的战略获得成功。如果对手具有僵局或僵局类型的偏好，那就只有谈判能提供可在战略上实现合作的途径；甚至这种可能性取决于军备竞赛与对手们在其他议题上（例如，贸易）互动规则之间先前存在的联系。类似于单边战略的行动可能被采取，而且可能降低军备竞赛的强度，但并非是对合作的渴望激发了这些行动；只有从安全视角被认为是最佳选择时，这些行动才会被采取。默示讨价还价战略完全不会被应用。僵局驱动型的军备竞赛可能比通常假定的更为普遍，这种可能性有助于解释以下两个现象发生的原因：相对来说，合作战略极少被运用，即使是在以合作告终的军备竞赛里；已经发生的合作通常是被某种经济变化和第三方干预促成的。

如果一场军备竞赛可以被描述为完美信息条件下进行的囚徒困境（至少从偏好序列的视角看），合作与三个合作性战略全部成功的前景将更乐观——倘若某些关键的假定被证明为正确。假定双方的驱动力都是安全需要而非对政策影响的渴望——很可能是错误的假定——通过削减对手攻击性军备政策的收益和降低单边战略使用国后来的合作成本，单边战略也许会推动合作。假定未来合作的收益（未来的影响）与军备竞赛中落后的潜在成本相比足够大——国家通常不愿做出的假定——“一报还一报”的默示讨价还价战略也许是终结军备竞赛的一种有效方式。通过建立军备竞赛与其他博弈或议题间的链接，谈判在囚徒困境中能够成功。只要这种链接中的收益可以被撤销以惩罚背叛，就存在着持续合作的动机。

当我们放弃完美信息的假定，并且承认经常出现在现实的——与假定相反——军备竞赛中的信息和控制问题，每一种战略都面临着额外的限制。在单边战略的情况下，成功的最大威胁来自解读问题。有兴趣发起行动结束安全困境的政府所认为的防御性事物，也许不会被它的对手如此看待。在默示讨价还价的情况下，解读问题也是最令人担忧的，但是那些信息与控制问题也非常重要。发起国所认为的合作性活动被正确执行、观察和解读的概率的些许降低，对于一个默示讨价还价战略来说，就可能导致令人吃惊的不佳后果，而该战略在最优条件下可能获得令人称赞的成功。在谈判的情况下，战略误导能够如此混淆互动的性质，以至于原本潜在的黄金合作机遇被就此错过。

不确定性阻挠合作战略的适用，理解不确定性的来源也有助于我们理解这些合作战略的某些特别优势。如果能够克服它们适用的固有问题，这些战略将有助于揭露与正在发生的军备竞赛的性质有关的关键性事实，而且有助于缓和军备竞赛中产生于误导而非根本性政策不一致的组成部分。单边战略能够提供一条特别安全的途径，用于试图确认对手的动机和鉴别正在进行的博弈。如果一个防御性联盟或武器系统导致的军备活动，远远多于仅仅合乎逻辑地产生于错误知觉的军备活动，那么两国正在进行的博弈就不是猎鹿博弈，对手的动机中既有政策影响的目标也有安全考虑。在一个对小的合作与背叛事件进行迅速回应并且具有高度重复性的背景下，实施简单的默示讨价还价战略能够提供一个非常好的环境，因为身处其中的国家能够了解彼此的偏好与合作意愿。本身不受误导困扰的谈判，偶尔能够揭示一些信息，即使在缺乏协议的情况下，这些信息引导双方相信军备竞赛的强度确实能够被削减。

最后，对于一个有兴趣推动合作以应对单个战略困境的国家来说，最好的方式是同时执行所有战略。从以互补方式利用这些方法的观点看，这一联合战略当然可取，但是它们经常彼此排斥的事实损害了这一联合战略。通过在谈判前增加武器生产与开发，谈判者也许希望将他们讨价还价的优势地位和威胁的可信性最大化，但是这通常摒弃了“一报还一报”的讨价还价战略中的妥协部分。当武器在性质上是进攻性的——为了给对手提供以谈判中止军备竞赛的最大激励——单边战略难以施行。“一报还一报”与单边战略也有些矛盾，因为对竞争者增加进攻性武器的“惩罚”需要以类似行动作为回应。当然，事实是，即使这种惩罚被执行，单边战略也可被继续。但是，惩罚行动所导致的紧张氛围的加剧，将极大地增加误读的可能性。这些矛盾的存在，使得了解这些战略在不同环境下的相对效力显得越发重要。

注释

1．Robert Jervis, Perception and Misperception in International Politics（Princeton: Princeton University Press, 1976）；and，more notably，Jervis, “Cooperation under the Security Dilemma,” World Politics 30（January 1978）, pp.167—214.

2．Robert Axelrod, The Evolution of Cooperation（New York: Basic Books, 1984）.

3．Howard Raiffa, The Art and Science of Negotiation（Cambridge: Harvard University Press, 1982）.

4．塞缪尔·亨廷顿在《军备竞赛：前提与结果》（Public Policy 8, 1958, 41—86），保罗·肯尼迪在《战略与外交》（Ayelsbury, England: Fontana, 1984, 163—178）中，提供了没有导致战争的军备竞赛事例。二者之中，亨廷顿的列表更为全面，如下：

（1）法国vs.英国　　　　　1840—1866

（2）法国vs.德国　　　　　1874—1894

（3）英国vs.法国和俄罗斯　1884—1904

（4）阿根廷vs.智利　　　　1890—1902

（5）英国vs.德国　　　　　1898—1912

（6）英国vs.美国　　　　　1916—1930

（7）日本vs.美国　　　　　1916—1922

（8）美国vs.苏联　　　　　1946—

肯尼迪仅把注意力倾注于大国，除阿根廷与智利1890年至1902年之间军备竞赛外，他认可上面列表中的全部；在一些日期上小有差异。

5．Richard Cobden, The Political Writings of Richard Cobden（London: William Ridgway, 1868）；Kennedy, Strategy and Diplomacy； Arthur J., Marder, The Anatomy of British Sea Power（New York: Octagon Books, 1976）.

6．这里的关键是偏好结构；因为我们的研究目的，2×2博弈的其他条件不一定要坚持。序贯博弈的结构似乎是最合理的，尽管哈里森·瓦格纳认为在这样的结构中，每一个参与者采取行动的条件是对其他参与者行为的了解。参见R.Harrison Wagner, “The Theory of Games and the Problem of International Cooperation，” American Political Science Review 77（June 1983）, pp.330—346.这更像是把问题划定在范围之外而非解决问题：如果信息流动得足够快并且控制得足够好，以至于一方可以在一周后回应对手的行动，那么这一方可以把其模式化为“一周一博弈”。瓦格纳所运用的对延展型的分析似乎有些不必要的繁琐。

7．为了减少必须讨论的事例数量，这里的分析只关注一个参与者的支付情况而不是整个博弈的支付情况。一旦对个别参与者的行为序列做出分析，就可以使用偏好模式的集合来构建实践中的博弈。那些通常用来指代对称性博弈的术语如“囚徒困境”，也可以用来指代参与者之一的偏好模型。

8．几位作者使用违反了这一条件的胆小鬼博弈以显示冲突情况。例如，Glen Snyder and Paul Diesing, Conflict among Nations: Bargaining, Decision-Making, and System Structure in International Crisis（Princeton: Princeton University Press, 1977）.然而，胆小鬼博弈是高度不稳定的，对于持续背叛的军备竞赛来说并不是一个现实的模型。

9．后面我们将会看到，当完美信息的假定被放宽时，这些被排除在外的博弈中有一些将会导致军备竞赛。

10．Snyder and Diesing, Conflict among Nations； Jevis, “Cooperation under the Security Dilemma”.两文中给出了各种博弈的术语。斯奈德和迪辛对博弈有着不同的选择，因为他们对国际危机——短期的事件——而不是军备竞赛的长期舞台感兴趣。杰维斯主要关注猎鹿博弈，这是我们在随后的部分要研究的一个重要分个案。

11．Lewis F.Richardson, Arms and Insecurity（Chicago: Quadrangle, 1969）.

12．迈克尔·华莱士最近的研究指出军备竞赛与战争之间存在着非常密切的关系。参见Michael Wallace, “Arms Races and Escalation: Some New Evidence,” Journal of Conflict Resolution 23（March, 1979）, pp.3—16；“Armaments and Escalation,” International Studies Quarterly 26（March 1982）, pp.37—56。然而，随后的一些分析对这一关系表示了强烈的质疑；参见Henk W.Houweling and Jan G.Siccama, “The Arms Race—war Relationship: Why Serious Disputes Matter，” Arms Control 2（September 1981）, pp.157—197。

13．Jervis, “Cooperation under the Security Dilemma”.

14．Ibid.

15．Freeman Dyson, Weapon and Hope（New York: Harper & Row, 1984）.

16．Cobden, The Political Writings of Richard Cobden, p.376.

17．Ian Colvin, The Chamberlain Cabinet（New York: Taplinger, 1971）.

18．A.J.P.Taylor, The Struggle for Mastery in Europe, 1848—1914（London: Oxford University Press, 1971）.

19．正如同英国外交大臣帕默斯顿（Palmerston）在伦敦会议后所写：

法国应该能感受到这一安排带给她的巨大优势。随着笔尖的一划，过去一直作为攻击法国领土据点的整条比利时战斗堡垒防线，现在立刻消失了；这里衔接着法国距离本国首都最近的、受自然或人工防御保护最少的边境地区。英国自愿约束她自己……同时北欧强国自愿关闭在敌意引领他们接近法国边境时他们必然要经过的大门。因此，在这个议定书中，法国应该看到鼓舞着其他欧洲强国的和平精神的最显著、最明确的证据……

转引自Willam Lingelbach, “Belgian Neutrality: Its Origin and Interpretation,” American Historical Review 39（October 1933）, pp.60—61。

20．Cobden, The Political Writings of Richard Cobden, p.259.

21．事实上它是否将减缓军备竞赛，是一个复杂的问题。可以认为，既然双方的边际收益都被削减，另一方应该减少进攻性武器的制造；也可以认为，既然达到一个特定目标需要更多的进攻性武器，另一方会建造更多的进攻性武器。如果没有进一步的假定，任何结果都是可能的。假定一方建造防御性武器，从而使另一方每一个武器的效力比原来降低10%。这将同时产生两个方面的效果。首先，它把所谓的一个武器效力单位的价格提高了10%，换句话说，实现一个给定目标所需武器的金额。其次，它使每一个武器效力单位所需的武器数目增加了10%。如果对武器效力单位的需求价格弹性是-1，那么价格上10%的增加将会导致购买武器效力单位的数量上10%的削减。然而，因为实现每一个武器效力单位需增加10%的武器数量，武器的数量将保持同样的数字。如果需求的价格弹性大于-1（例如-0.5），武器建造的数量将增加；反之，如果需求的价格弹性小于-1（例如-1.5），武器建造的数量将下降。

22．Raiffa, The Art and Science of Negotiation, p.131ff.

23．Axelrod, The Evolution of Cooperation.

24．Stephen Van Evera, “Why Cooperation Failed in 1914”.

25．Cobden, The Political Writings of Richard Cobden.

26．Harold Sprout and Margaret Sprout, Toward a New Order of Sea Power: American Naval Policy and the World Scene, 1918—1922, rev.ed.（Princeton: Princeton University Press, 1943；Reprinted by Greenwood Press, 1969）；Robert A.Hoover, Arms Control: Interwar Naval Limitation Agreements（Denver: Monograph Series in World Affairs, University of Denver, Vol.17, Book 3, 1980）.

27．Quincy Wright, The Existing Legal Situation as It Relations to the Conflict in the Far East（New York: Institute of Pacific Relations, 1939）.

28．Ibid.，p.102.

29．Strobe Talbott, Endgame: The Inside Story of SALT Ⅱ（New York: Harper & Row, 1979）.

30．Calvin DeArmond Davis, The United States and the First Hague Peace Conference（Ithaca NY: Cornell University Press, 1962）.

31．Arnold Horelick and Myron Rush, Strategic Power and Soviet Union（Chicago: University of Chicago Press, 1966）.

32．Cobden, The Political Writings of Richard Cobden；F.W.Hirst, The Six Panics（London: Methuen, 1913）.

33．Cobden, The Political Writings of Richard Cobden, p.240.

34．G.P.Gooch, Franco-German Relations, 1817—1914（London: Methuen, 1913）.

35．Alain Enthoven and Keith Smith, How Much is Enough?（New York: Harper & Row, 1971）, p.178.

36．转引自William Kauffman, The McNamara Strategy（New York: Harper & Row, 1964）, p.284。

37．Jervis, “Cooperation under the Security Dilemma”.

38．Ernest R.May, “Lessons” of the Past: The Use and Misuse of History in American Foreign Policy（New York: Oxford University Press, 1973）, p.33.

39．Ibid., p.35.

40．David Finlay, Ole Holsti, and Richard Fagen, Enemies in Politics（Chicago: Rand McNally, 1967）, p.60.

41．Graham Allison, The Essence of Decision（Boston: Little, Brown, 1971）, p.142.一连串有趣的调查对土耳其导弹事件的解释提出挑战；参见Barton Bernstein, “The Cuban Missile Crisis: Trading the Jupiters in Turkey?” Political Science Quarterly 95（Spring 1980）, pp.97—125。

42．Morton Halperi, Bureaucratic Politics and Foreign Policy（Washington, DC: Brookings Institution, 1974）.

43．George Quester, Offense and Defense in the International System（New York: Wiley, 1977）.

44．Anthony Kemp, The Maginot Line: Myth and Reality（London: Frederick Warne, 1981）.

45．Taylor, The Struggle for Mastery in Europe, 1848—1914, p.404.

46．Axelrod, The Evolution of Cooperation, p.192ff.

47．Ibid., p.182ff.

48．Ibid., pp.138, 186ff.

49．Hirst, The Six Panics, p.39.

50．Thomas Schelling, “Reciprocal Measures for Arms Stabilization,” in Donald Brennan, ed., Arms Control, Disarmaments, and National Security（New York: George Braziller, 1961）, p.175.更近一些时候，罗素·伦（Russell Leng）展示了以回报为基础的战略在苏美关系中的效力。Russell Leng, “Reagan and the Russian: Crisis Bargaining Beliefs and the Historical Record,” American Political Science Review 78（June 1984）, pp.338—355.

51．Robert Burr, By Reason or Force: Chile and the Balancing of Power in South America, 1830—1905（Berkeley: University of California Press, 1965）.

(1)　我们感谢加州大学戴维斯分校文理学院、加州大学全球冲突与合作研究所和加州大学戴维斯分校政府事务研究所的支持。在对华盛顿海军会议和海牙会议的研究上，格雷格·格利森（Greg Gleason）提供了帮助。罗伯特·阿克塞尔罗德（Robert Axelrod）、罗伯特·杰维斯（Robert Jervis）、肯尼思·奥耶（Kenneth Oye）、格伦·斯奈德（Glenn Synder）、斯蒂芬·范·埃弗拉（Stephen Van Evera）和弗兰克·扎加雷（Frank Zagare）的评论也让我们受益匪浅。