概率论的基础问题
现代归纳逻辑的发展是同概率论应用的推广与发展分不开的。对“概率是什么?”这个问题的各种不同解答构成了三个世纪以来概率基础研究的历史,而这个历史即是发现测定概率值的新方法和归纳推理的新方式的历史。这种发现是由概率概念的应用领域的不断扩充所决定的。
在最初,应用概率概念所要解决的问题和所取得的成果都同机会对策(game of chance)或赌博问题有关。直到十八世纪,大多数应用仍然集中于赌博问题上。甚至在实际情况已经改变以后,机会对策还是一个特别的模型。人们往往尝试把每个问题都还原为赌博问题。
在赌博中,概率值的测定问题是容易解决的。由于赌博装置的性质或赌博所规定的条件,概率值总是可能测定的。赌博装置(硬币、骰子、纸牌、轮盘)提供同等可能的基本事件。有利事件也同样地可以测定。因此,由于测定有利事件对同等可能事件的总数的比率,概率值的测定总是可能的。这是一个测定概率值的方法,它以对赌博装置的知识为基础。由这种知识得出一个给定集合中的事件具有相等的概率这个结论。古典概率论在发现这个方法以后,便把概率定义为有利事件对同等可能的事件的比率。
拉普拉斯的名著《分析的概率论》(1812)使概率论成为一个完全的科学理论,并大大扩充它的应用领域。这部著作支持古典定义作为概率论的基础,但在把概率论推广到新的应用领域时,它又使古典定义的不适当或不充分变得更加明显了。因此,越来越清楚,古典定义所反映的仅仅是概率论的一个应用领域中所使用的测定概率值的方法,它完全忽视其他的也很重要的测定方法。
在十七和十八世纪,甚至同保险业有关的问题也广泛地应用概率概念。就是说,给定了某一事件在一系列的过去场合中在给定条件下发生的频率,问题是要测定在一个未来场合当那些条件再次满足时它将发生的频率。
在拉普拉斯对概率论作出科学的确切陈述之后,自然科学就成为应用概率概念的新领域。拉普拉斯本人应用这些概念于天文学、大地测量学、潮汐理论和气象学中,哥尔登(F.Galton)应用概率论于遗传研究中,也由于毕尔生(Karl Pearson)、戈塞特(W.S.Gosset)和费希尔(R.A.Fisher)对生物统计学的贡献,使概率论成为科学实验的绝对必要的工具; 这就是说,从十九世纪下半叶以来,统计理论就取代机会对策成为概率论的特别模型了。
统计学家宣称其使用的概率概念是具有一定特征的个体数对一个“假设性无穷大”的总体中的个体总数的一种比率。统计学家从来未曾阐明这后一名词的意义,因此他们所用概率概念是意义含糊的。另一方面,他们测定概率值的方法却不是意义含糊的。这种以相对频率的知识为基础的方法决不可能化成有利事件对同等可能事件的比率。冯米泽斯批评古典定义在概率概念的更为重要的应用领域是完全不适用的,例如在计算一个人死亡的概率时,决不能使用古典定义所揭示的方法。一般地说,不可能把数理统计中所用计算概率值的方法化成机会对策中使用的方法,所以古典理论和冯米泽斯理论的明显差别与其说是在定义上,毋宁说在计算概率值的方法上。冯米泽斯试图使概率论中所用的概率概念适合于二十世纪初期数理统计中所用的计算概率值的方法,从而为已被统计学家广泛采用的计算概率值方法提供概率论的基础。频率主义理论获得成功的理由就在这里。
但是频率主义者根据他们的概率定义赞成一种计算概率值的方法,而忽视一切其他的方法。他们独断地否认有发现新方法的可能。对他们来说,一个概率陈述仅当以重复的实验观察为基础时才是有意义的,否则便是无意义的。
然而,同频率主义者的狭隘观点相反,为不可重复事件,或者更一般地说,为假说测定概率值的各种方法亦已被数理统计学家精心地完成,例如估计方法(Methods of estimation)和检验统计假说的理论。这些方法的基础是使联系假说和实验已知件的逻辑关系转为数值。按照费希尔的说法,这些推理诚然不是确定的,但不能由此得出: 它们不是数学地严格的。
另一方面,概率概念应用的扩充使频率主义者对概率概念所加的限制显得毫无理由。二十世纪三十年代以来,这些概念越来越多地应用于工商业管理中,工厂对大量生产的质量管制就是一个好例子。要在这些场合中作出任何决策,人们必须为他们先前并没有多少经验的事件计算概率值。所以频率主义观点同概率概念的这种应用便成了明显的对比。正如德·芬内蒂指出的,“不难承认,在实际预测(比赛结果、气象事实、政治事件等等)的场合中,主观主义的解释是唯一适用的……”[1]显然,在德·芬内蒂提到的这些场合中,计算概率值的方法必定不同于以相对频率为基础的方法。
总的说来,统计学家已精心完成给不可重复事件计算概率值的方法。这些方法并不依据关于对频率的知识,至少不仅依据相对频率。已有计算概率值方法的事件的范围较之频率主义者所设想的大得多。如果统计学家不接受假说的概率这个概念,那么正像杰弗里斯说的,他们便会“剥夺了自己可以确切地说当他们在假说之间作出抉择时他们究竟是什么意思的方法”[2]。
逻辑主义者和主观主义者的概率定义是试图把概率概念的这些新用途协调起来的表现。就是说,这是一种使用概率定义来重建现代数理统计中为并没有大量的过去经验可用的假说测定概率值的方法的尝试。
逻辑主义的定义和主观主义的定义有相同目的,但由于各自适用于概率概念的不同的统计用途,而有差别。逻辑主义者的尝试适用于统计学家精心完成的测定假说的概率值的方法。从凯恩斯到卡尔纳普,逻辑主义有一个较长的发展时期,当卡尔纳普的《概率的逻辑基础》(1950)出版时,至少就概率的基础研究而论,频率主义的观点已经衰落了。逻辑主义者中间提出许多不同的、有时甚至彼此相反的概率定义。但重要的是: 这些定义都是重建数理统计所使用计算概率值的方法的尝试。例如杰弗里斯的概率定义和他的工作同统计方法有如此密切关系,以致它们是代表贝叶斯主义重建数理统计的最初的和最好的尝试之一。
主观主义者所提出的概率定义也是借助于概率定义使概率论同现代统计理论所用方法相适合的尝试。只要研究一下蓝姆赛的概率定义就可以弄清楚这一点。