推理方法上的革命
按照主观主义者的看法,概率表示某个人根据给定的证据对一个给定陈述所具有的相信度(Degreeofbelief)。相信度的概念最早可以追溯到伯努利(James Bernoulli)。他把概率定义为对一个我们不能确知其真的命题的置信度(Degreeof Confidence)。这个置信度随个人所掌握的知识而定,因此是因人而异的。猜测的艺术(artsofconjecture)就在于尽可能确切地估计最好的概率值。较近代的逻辑学家德摩根更明显地把概率定义为相信度。他说: “我们使用概率度的真实意思是指,或应当指相信度。……这样概率指称或蕴涵或多或少的信念,而信念不过是不完全知识的别名,或者也许表达处在一个不完全知识状态中的心灵。”[3]
蓝姆赛在主观主义者中的开创者地位在于他把相信度同效用(utility)或好处(goods)的概念以及同公开选择联系起来,从而明确给出一种测度信念的方法,他说: “我们必须试图发展一种测度信念的纯心理学方法,测度概率是不够的; 要正确地把我们的信念分配给概率,我们必须也能够测度我们的信念。”[4]他又指出,“同概率有关的这种信念测度”并不是测度信念—感觉的强度,“而是当作行动基础的信念的测度”[5]。因此,测度一个人的相信度的理论上唯一健全的方式便是检查他的公开行为。大多数主观主义者都追随蓝姆赛,把相信度等同于特殊的行为,例如下一赌注,或者拿金钱为一个事件而非另一事件的发生打赌。对大多数主观主义者来说,相信度是由在一个客观地明确的选择情况中作出某种特定选择的倾向所构成的。
蓝姆赛进一步引进数学期望的概念。谈到一个人的行为,他说:“我提议引进这样一个心理学定律: 他的行为是受那叫作数学期望的东西所支配的; 就是说,如果P是一个他对之怀疑不定的命题,依他看任何好处或坏处的实现以P为必要和充分条件时,在他的计算中便要用叫做‘他对P的相信度’的同一分数来乘这些好处或坏处。我们这样便以预设数学期望的使用这种方式给置信度下定义。”[6]蓝姆赛给相信度或主观概率所下的定义为现代的统计决策论,即贝叶斯决策论或“主观期望效用极大化理论”(Subjective Expected Utility Maximization Theory)和私人主义的(personalist)概率论奠定了基础。
很明显,蓝姆赛的以相信度为基础的概率定义也就是现代统计决策论所用的测定概率值的方法。新的贝叶斯决策论是由要应付频率主义者沃尔德(A.Wald)的统计决策论所遇到的困难而兴起的。决策问题的解决需要假设有对一切可被考虑假说的“先验的”概率分布。但除了这些先验概率能够被解释为相对频率的稀罕场合外,沃尔德拒绝这种解决方法。而萨维奇则抓住先验概率可以解释为一个合理行动者的相信度的见解,进而发展出可为这样的行动者下定义的公理集。萨维奇的公理蕴涵着一个合理行动者有关于可被考虑的假说的概率函数,和关于一切可能结果即“选择一假说对”(choice-hypothesispairs)的效用函数。相信度是主观概率,归纳推理根据对新证据的条件化(conditionalization)过程而进行。贝叶斯定理在这里的中心地位从萨维奇给他自己观点的名称“贝叶斯私人主义”可以看出来。他的著作《统计学基础》(1954)代表新的贝叶斯传统。三十年来贝叶斯运动在统计理论和实践中得到很大发展。主观贝叶斯主义或私人主义已成为现代归纳逻辑和决策论中一个强有力的学派。
贝叶斯统计理论的基本论题是: 数理统计以贝叶斯定理为基础。就是说,每个统计推理都从先验概率的分配开始,在把观察证据考虑进去以后,这些先验概率即被改变为后验概率。按照贝叶斯主义,先验概率和后验概率都是合理置信度,都是主观概率。新统计理论和正统统计理论的区别就在于后者否认主观概率,把概率论的应用领域限制于频率定义可以适用的一类问题,使概率论方程成为不过是计算频率的规则。正统统计学强调“随机实验”。它仅仅发展了处理“抽样分布”的方法,它甚至不承认有先验概率,这就使概率论的一半——如何把先验信息或背景知识转变为先验概率的分配——处于落后状态。杰弗里斯(《概率论》再版,1948)认识到这一半是任何完整的推理理论的一个必要部分,并且开始发展这些技术。物理学家杰恩斯(F.T.Jaynes) 从1957 年开始便提出以极大熵原则(Principle of Maximum Entropy)作为归纳推理的基本工具,他指出这个原则对于发展概率论的那缺少的一半已证明是很有用的。这就是说,他从极大熵原则导出先验的概率分布。他说: “PME(极大熵原则)属于概率论那被忽略的前一半; 贝叶斯定理属于后一半,它仅仅在先验概率已被PME或其他的一个原则所指定以后才开始工作。”[7](当然,给定一个先验概率,贝叶斯定理也能够决定同它一致的其他先验概率。)要知道在归纳推理中指定或分配先验概率是关键性的,也许这是最能表现归纳法特征的一步,其余的便是计算工作了。因为在贝叶斯推理结构中,假设开始时我们就有了先验的概率分布,情形便和正统的统计实践大不相同。我们不是把由分析样本得来的统计假说投射到未被观察的事件中去,只不过把条件概率算出罢了。但归纳原则体现在先验概率的选择中。这个先验分布是由我们所预期的那种统计规律性所决定的。
杰恩斯认为在概率论的应用中使用主观概率是推理方法的革命,其重要性比起科学革命中一个范式(例如进化论或相对论)取代另一个有过之无不及。“新革命同一切人类推理的原则有关,并且它以同等力量适用于一切科学领域,”[8]他主张科学家对概率的态度应当像他们对同时性的态度一样。“并没有什么‘绝对的’或‘物理的’概率; 这个同绝对同时性一样是幻象。然而我们每人都有他自己的‘主观的’概率,这概率决定于(或者说描绘)他的知识状态; 这个对于进行他的推理是必要的。合理思维的实现并不在于排斥‘主观的’概率,而在于承认它们的主观性,以便我们能够给予适当的修正,这个‘修正量’就是贝叶斯定理,它表明我们给一个事件分配的概率怎样地随我们知识状态的变化而改变。”[9]
所以,概率和频率之间的根本的、不可避免的区别就在于这个相对性原则。概率随我们知识状态的变化而变化,而频率则不然。把两者混淆起来容易产生思想混乱,因为它将导致我们不能够把实在和自己关于实在的知识严格区别开来。作为一个物理学家,杰恩斯这样表白他自己的心情: “藏在我关于统计理论的一切工作后面的最深刻的动机不只是渴望有更有力的实际推理方法,倒是这个坚定的信心: 对物理定律的基本理解的进展被实证主义的哥本哈根哲学所妨碍至今有了五十年,这只有把现在给物理学家讲的世界观加以激烈改变才会重新开始。现在的量子理论含有大量的很基本的真理; 但它的数学所描绘的东西部分是物理定律,部分是人的推理过程,一切都以这样的方式搅拌起来,以致还没有人知道如何把它们分离开。许多年以前我便深信把这混杂一团清理出来需要这样地重新阐述概率论本身,以便它明显地认出人的知识的作用,从而恢复现在量子论中已经消失的实在和我们关于实在的知识之间的区别。贝叶斯概率论似乎是能够做到这件事的唯一方法。”[10]
杰恩斯这种严格区别概率和频率的见解比蓝姆赛早就发表的类似见解又进了一大步。蓝姆赛由大都采取频率论的统计学家和大都拒绝频率论的逻辑学家之间的分歧,推论到“这两个学派事实上是在谈论不同的东西,‘概率’这个词被逻辑学家使用时是一个意义,被统计学家使用时却是另一个意义”[11]。但他似乎认为概率在逻辑中的意义不必适用于物理学。所以在主观概率之外他还承认频率或物理概率的重要性。六十年后的今天,虽然也许整个来说仍占少数,但已有越来越多的统计学家接近贝叶斯主义; 更重要的,主观概率在物理学乃至一切科学中的应用及其革命性的后果,杰恩斯说得十分透辟,而且他认为“贝叶斯理论要比‘频率论’更有效地使用频率概率”,它的统计实践“包括概率论所发现的一切有用结果为其特殊场合”[12]。“在应用中所使用的概率和频率之间的每一联系经过分析都已证明是可作为概率论的拉普拉斯——杰弗里斯——考克斯 (R.T.Cox)[13]形式的后承推导出的”[14],因此频率定义便可以废弃不用了。这是蓝姆赛所完全未曾预料的新发展。