趋向性的适用情形
在诠释特定的赌博情境时概率的主观诠释也有可能站得住脚,例如赌马。赌马中事件的客观条件是不良定义的,也是不可再现的。(但是,我确实不认为主观诠释可以应用于像这样的情况:我们可以构造一个强的情境——如果值得这么做的话——其中赌徒或“理性的打赌者”在打赌时想知道的是事件的客观条件、客观趋向性和客观赔率。于是下注者急于知道的是关于赛马的更多信息,而不是他自己的信念状态或他所掌握信息的逻辑强度。)然而在典型的机会游戏——例如轮盘赌、投掷骰子或抛掷硬币中,同时在一切物理实验中,主观诠释都完全失败了。因为在所有这些情形中概率都取决于实验的客观条件。
在《逻辑》中我考虑的仅仅是一种概率的客观诠释——纯粹统计的或频率诠释。(我认为这两个术语是同义词。)在那本书中,我一一驳斥了一般针对它的种种批评,通过这种方法试图重建这种诠释。在这里我想说,还存在第二种客观诠释,也是更好的一种诠释——趋向性诠释。我提出这个建议并不是因为有什么针对频率理论的批判得到证明。相反,我坚信频率理论是一致的,同时相信它能在实际中应用。但我也相信趋向性诠释具有决定性的优势。我将在本节中给出我的一些理由,而将另一些理由留至后文另行阐述。
在本节我的讨论将仅限于诠释“单称事件”(或事例[occurrence])的概率这个问题,而当我在这里谈论与趋向性诠释相对的“概率的频率诠释”时,我指的是单称事件的概率的频率理论。
我们应该记得,从概率的频率诠释的观点来看,一个特定事件——例如投掷某个特定的骰子而获得六点——的概率正是此种事件在某一极长(可能是无穷长)事件序列中的相对频率。如果我们谈论的是一个单称事件(在《逻辑》第23节的意义上此即“事例”;另外参见第71节)的概率,例如这粒骰子在今天早上九点钟之后的第三次投掷中获得六点的概率,那么根据纯粹统计诠释,我们的意思是只有这第三次投掷应当被视为投掷序列中的成员,而因其能够成为这个序列的一员,所以它也拥有此序列的概率;也就是说,仅仅是作为此序列的相对频率的概率。
在本节中我将用论证来反驳这种诠释,并支持趋向性诠释,为了做到这一点我将使用上一章中得到的结果,即客观实验条件在概率诠释中的重要性。我的步骤是这样的:(1)我将首先表明,若从频率诠释的角度来思考,人们必定会有许多反对意见来驳斥趋向性诠释,并将之视为不可接受的。(2)随后我将概要性地回应这些反对意见。(3)然后我将提出频率诠释必定会遇到的一个难题,虽然这个难题乍看上去并不太严重。(4)最后我将指出,为了克服这个难题,我们必须要对频率诠释加以修正,这个修正初看上去很轻微,可采纳了这个表面上看似微不足道的修正,就等于采纳了趋向性诠释。
(1)从纯粹概率统计诠释的立场来看,趋向性诠释显然不可接受。因为“趋向性”可以被解释为概率(或可能性的测度或“权重”),而概率具有自我实现的倾向,它在长序列重复实验中的实际实现也关系到统计频率。因此引入趋向性是为了帮助我们说明或预测特定序列的统计特性,这也是趋向性的唯一功能。因此(坚持频率理论的理论家们会断言)它不允许我们去预测或谈论单称事件的任何性质,除非单称事件在同样条件下的重复能够产生具有特定统计特性的序列。这表明了趋向性诠释给频率诠释增加的不过是一个新词汇——“趋向性”——以及一个与之相关联的图景或隐喻——即某种倾向、意向或趋向。但这种拟人论的或心理学的隐喻甚至还没有“力”或“能量”这些旧的心理学隐喻有用,虽然后者要成为有用的物理学概念也必须褪除自身原来形而上学的或拟人论的意义。
粗略而言,这就是频率理论家们的观点。下面我将为趋向性诠释做辩护,我将使用两个不同的论证:其中(2)是初步的回应,而(3)和(4)将是我用来扭转局面的主要论述。
(2)作为初步的回应,我打算接受如下观点:趋向性观念与力的观念,尤其是力场的观念之间存在着某种类似。虽然“力”或“趋向性”这样的称谓都有可能是心理学的或拟人的隐喻,但这两个观念间的类似并不在于这一点,而更多地在于:这两个观念关注的都是物理世界的种种不可观察的意向特性,因此它们将有助于我们诠释物理理论。它们的用处在这儿。力的概念——尤其是力场的概念——引入了一种意向性物理实体,它是被某些方程式(而非隐喻)所描述的,为的是解释可观察的加速度。与此相似,趋向性概念,或趋向场的概念,引入了单称物理实验安排,也即单称物理事件的某种意向特性,为的是解释这些事件的重复序列的可观察频率。在这两个情形中,新观念的引入都因其对物理理论的有用而变得合法。在贝克莱的意义上这两个概念都是“超自然的”或“仅仅是词语而已”。但这些概念之所以有用的部分原因正在于,它们暗示理论关注的是某种不可观察的物理实体的特性,我们能够观察的仅仅是这个实体的某些非常表面的效应,而借助这些效应我们才有可能检验此理论。(见上文第11到15节。)支持趋向性诠释的主要论据在于,它能够消除量子论中某些非理性和主观主义的扰动因素——这些因素比趋向性更“形而上学”,而且这是负面意义上的“形而上学”。我们在评价趋向性诠释时,应该考虑的是它在这个应用领域中能否取得成功。[4]
以上就是初步的回应,下面我将论述支持趋向性诠释的主要论点。上文已经提到,在此步骤中我将指出频率诠释必须面对的特定难题。
(3)已有许多反对意见指向概率的频率诠释,特别是它与事件的无穷序列的观念,以及与相对频率的极限概念的关系。但在这里我不打算涉及这些反对意见,它们将留待下节讨论。(它们整体上无效。[5])但据我所知,我下面将提出的一个很简单而又很重要的反驳以前还没人提过。
假定我们有一粒灌铅的骰子,在经过长实验序列后,我们发现了一个令人满意的结论:这粒灌了铅的骰子得到六点的概率非常接近于¼。现在让我们考虑一个序列b,它既包括这粒灌铅骰子的许多次投掷,也包括另一粒同质的、对称的骰子的几次(例如两三次)投掷。那么显然,在涉及这粒“公平的”骰子的那几次投掷时,我们必须说获得六点的概率是⅙而非¼,但问题是根据我们的假定,这几次投掷也属于某一序列的成员,而此投掷序列的统计频率是¼,另一方面,两三次投掷又不可能影响长序列的频率为¼。
我认为这个简单的异议是决定性的,虽然可能对其进行各种反驳。
下面将给出其中一种反驳,但我仅打算略述一二,因为它相当于退守到了概率的主观主义诠释的立场上。它等同于断言,正是我们关于这粒公平骰子的几次投掷的特殊知识、特殊信息改变了概率。根据我对主观理论的一贯立场,不需明说读者也该知道,我认为这种观点是不成立的。此外,我们现在讨论的这个例子还提供了另一种论证(虽然不是非常重要)来反对主观理论。虽然我们知道有两三次投掷是用正常骰子作出的,但我们却不一定知道具体是哪几次投掷。在此情形中,我们有足够充分的理由打赌(只要我们要赌的这个序列有充分的长度)此概率非常接近于¼,哪怕我们知道存在着两三次投掷,要是能识别出它们的话我们就不会赌这个数值。我们知道在这几次投掷的情形中六点的概率小于¼——实际上是⅙;但我们也知道我们无法识别出这几次投掷,而且如果赌的次数很多的话它们的影响必定很小。现在显然的是,即便我们仍然会赋予这些未知的投掷以⅙的概率,但这里的“概率”并不意味着——也不可能意味着——“依据我们的总体实际知识得出的合理赌注”(但主观理论就是这么认为的)。
现在让我们离开主观理论,看看频率理论将如何回应这个异议。
在许多年中我自己就是一个坚持频率理论的人,因此我很明白我自己的回应将是这样。
根据上文对序列b的描述,我们知道b是一个混合投掷序列,其中包括灌铅骰子的投掷以及(例如)三次公平骰子的投掷。我们估计或猜想(基于先前的经验或直觉——猜想的“基础”是什么倒无关紧要),灌铅骰子的投掷序列中出现六点的频率是¼,而在公平骰子的投掷序列中则是⅙。将后一种序列,即公平骰子的序列表示为“c”。那么b的结构的信息告诉我们:(ⅰ)p(a,b)=¼,或非常接近此值,因为几乎所有投掷都是灌铅骰子作出的;(ⅱ)bc——即同时属于b和c的三次投掷的类——是非空的;而因为bc包含着属于c的投掷,所以我们有资格断言,在属于bc的那些投掷中,六点的单称概率等于⅙——理由是这些单称投掷都是某一序列的成员,而对于此序列我们有p(a,c)=⅙。
粗略地说,这曾经就是我的回应;但我现在认为它显然完全无法令人满意,我甚至在想,当时我怎么会满足于这样的解答。
当然,下面这两个等式

是完全相容的(在无穷序列也是如此)。另外,毫无疑问,这两个情形也能在频率理论中得到实现:我们有可能构造某个序列b满足等式(ⅰ),同时选取一个序列bc——这是一个极长的、无穷的虚拟序列,其元素同时属于b和c——满足等式(ⅱ)。但我们的上述例子并不属于此种情况。因为在我们的例子中bc不是无穷的虚拟序列。根据我们的假定,它只包含三个元素。在bc中六点出现的情况只能是无、一次、两次或三次。但它在序列bc中肯定不可能出现⅙的频率,因为我们知道这个序列至多包含三个元素。
因此在我们的例子中只有两个无穷的或极长的序列:一个是(实际[actual])序列b,另一个是(虚拟[virtual])序列c。我们要考察的那类投掷都属于二者。而我们的问题是这样的。虽然投掷都属于这两个序列,虽然我们只知道那些特别的投掷bc发生于b中的某处(我们不知道具体在何处,因此也无法识别出它们),但我们却坚信无论如何在这些特别的情形中正确的、真的单称概率是⅙而非¼。或换言之,虽然它们属于这两个序列,但我们却肯定知道,它们单称概率的估计值等于序列c的频率而非b的——这正是因为它们对应的是另一粒不同的(公平的)骰子,也因为我们的估计或猜想是,在公平骰子的投掷序列中,有⅙的情形会出现六点。
(4)所有这些都表明频率理论家们必须要对这个理论做一定的修正——当然是很细微的修正。现在他们得说,事件的容许序列(参考序列、“集合”)必须是一个重复条件的序列。或更一般地,他们得说,容许序列必须是由生成条件集刻划的虚拟的或实际的序列,此条件集的重复实现产生了一个独立序列中的种种元素。
如果这样来做修正,我们的问题就立刻得到了解决。因为序列b就不再是容许参考序列了。它的一部分,也即包含灌铅骰子的投掷部分(即b)将产生一个容许序列,对于这个部分我们完全可以处理。剩余的部分bc包含的是常规骰子的投掷,属于此类投掷的虚拟序列c——这也是一个容许序列。这一部分也毫无问题。显然,一旦采纳了这个修正,频率诠释就不再有任何难题了。
此外,我在这里给出的“修正”所阐述的,本身就是大多数频率理论家(包括我)一直都遵循的一个假说;这个修正不过是将之明确表达出来罢了。
但是,如果我们仔细考察这个表面上非常轻微的修正,我们就会发现它等同于从频率诠释到趋向性诠释的转换。
频率诠释总认为概率是相对于某一“给定”序列的;它有着下述假定:概率是某一给定序列的特性。但根据我们的修正,序列本身被定义为它生成条件的集合;这样一来,我们就可以说概率是生成条件的特性。
但这其中有着极大的差别,尤其对单称事件(或“事例”)的概率来说更是如此。因为现在我们可以说,单称事件a具有概率p(a,b)是因为它是根据生成条件b而产生的一个事件,而非因为它是序列b中的成员。这样的话,单称事件哪怕只出现一次,它也有可能具有某一概率;因为它的概率是其生成条件的特性:是生成条件产生出了它。
诚然,对于上述观点频率理论家们也会有不同意见:即使概率是生成条件的特性,但它也等于这些条件所生成的虚拟序列或实际序列之中的相对频率。然而,如果我们仔细考察这个想法的话就会发现,这样一来频率理论家们显然就已经是站在趋向性诠释的立场上了——尽管是不经意地。因为,如果概率是生成条件(例如实验组织)的特性,而且如果我们因此认为它取决于这些条件,那么频率理论家的上述异议就暗示着虚拟频率必定也取决于这些条件。但这意味着我们必须去实现这些条件,将它们视为蕴涵着某种倾向、意向或趋向性去产生其频率等于此概率的序列;而这些正是趋向性理论断言的内容。
有人会认为,只要我们用纯粹的可能性来代替趋向性,我们就可以避免这最后一步——将趋向性归因于生成条件。他们希望用这种方式来避免趋向性诠释中可能是最遭人非议的方面:它在直觉上带有类似于“生命力”这样的拟人论色彩,许多人常常根据这一点而将之称为空洞的伪解释。
用可能性来诠释概率,这是一个很古老的思想了。概率的经典诠释之一依据的就是相等的可能性,例如依据所有可能性的数量来划分出有利的可能性数量;对于这种诠释也存在着众所周知的反对(例如灌铅骰子的情形所表明的),出于论证的考虑,我们不准备讨论这个反对意见;同时,我们的讨论还将仅限于对称的骰子或硬币之类的情形中,这是为了在可能性定义和趋向性诠释之间做比较。
这两种诠释的共同点相当多。二者的首要关注都是单称事件,以及每个事件发生条件中固有的可能性。二者都认为这些条件在原则上可再现,因此它们能够产生事件序列。二者之间的差别似乎仅在于下述情形:趋向性诠释引入了那种遭人非议的形而上学趋向性,而可能性诠释则简单地归之于条件的物理对称性——归之于留待条件来加以说明的那些相等的可能性。
但这些共同点都是表面上的。要费一番力气才能看出,纯粹的可能性无法满足我们的目的,也无法满足物理学家或赌徒的目的;甚至这个经典定义也隐含地假定了,相等的可能性必定依附着实现这些可能性的相等的意向、倾向或趋向性。
如果我们首先考虑非常接近于零的等可能性[equi-possibilities],就很容易看到这一点。非常接近于零的等可能性的一个例子就是任意长度为n的有限0和1序列的概率:这种序列有2n个,因此在等可能性的情形中,每一个序列的可能性都为1/2n,对于较大的n这非常接近于零。而互补可能性则接近于一。一般我们会将这些接近于零的可能性诠释为“几乎不可能的”,或“几乎不可能实现自身的”,而接近于一的互补概率则被诠释为“几乎必然的”,或“几乎总可能实现自身的”。
但是,如果我们认为接近于零的可能性和接近于一的可能性都可以被诠释为预测——“几乎不会发生”和“几乎总会发生”——那么我们就会很容易明白,假定抛掷硬币获得正面或反面的两种可能性是穷尽的、排他的和相等的,那么它们也可以被诠释为预测。它们对应于预测“在长序列的大约一半情形中几乎能确定地实现自身”。因为根据伯努利定理(以及上文长度为n的序列的例子),我们知道在这种诠释看来,½的可能性逻辑上等价于上文关于接近于零或一的可能性的诠释。
换一种稍微不同的方式来说明这一点:纯粹的可能性无法产生任何预测。例如,明天将有一场地震(仅仅)摧毁南北十三度纬线之间的所有房子,这是可能的。没有人能计算出这个可能性,但在大多数人的估计中它是极小的;像这样纯粹的可能性不产生任何预测,但“它是极小的”这个估计有可能产生下述预测:这一事件(“在所有概率上”)不会发生。
因此,关于可能性测度的估计——即关于附属于它的概率估计——总有着预测的性质,但是,如果仅仅说某一事件是可能的,那么我们就不可能预测这个事件。换言之,我们不假定像这样的可能性有任何实现自身的倾向;但我们在诠释附属于此可能性的概率测度或“权重”时,确实认为这是在测度其实现自身的意向、倾向或趋向性;而在物理学(或打赌中),我们关注的就是这种可能性的测度或“权重”,并认为它有资格作出预测。因此不可避免地,我们会认为可能性测度就是意向、倾向或趋向性。我选择“趋向性诠释”这个名称的理由就是我希望强调,我们常常都忽略了上述理论——概率理论的发展历史也表明了这一点。
因此我并不担心人们说什么趋向性是拟人论的概念,或说它类似于生命力的概念等等。(这个概念确实空洞,我也不大喜欢它。但大多数有机体都有为生存而斗争的意向、倾向或趋向,这并不是一个空洞的概念,反而非常有用;而之所以说生命力这个概念空洞,恐怕是因为它本来打算说明下述断言,但又未能完成目标:大多数有机体都有一种为生存而斗争的趋向,在此过程中还产生了其他种种趋向,例如探索周遭环境和占据新的生态位趋向。)
总而言之,趋向性诠释坚持的是这样的观点,即概率都是长(实际或虚拟)序列中的猜想性或估计性统计频率。但是,因为我们将这些序列定义为它们元素的生成方式——即生产条件——所以我们必定要将猜想性概率附属到这些生成条件中:我们必定要承认,它们依赖这些条件,并会随之改变。对频率诠释的修正几乎不可避免地导致下述猜想:概率是这些条件的意向特性——也即趋向性。这允许我们将单称事件的概率诠释为单称事件本身的某种特性,而此特性的测度方法则是猜想性的潜在的或虚拟的统计频率,而非实际的或已观察到的频率。
像所有意向特性一样,趋向性在某些方面也类似于亚里士多德主义的潜力。但二者之间有着重大差别:和亚里士多德主义者所认为的不同,趋向性不可能为个体事物所固有。它们不是骰子、硬币的固有特性,而是某种更为抽象的东西,虽然本身在物理上是实在的:它们是总体客观情境的关系特性,它们是某种只依赖于我们猜想情境的隐藏特性。如果我们要检验我们的猜想,我们就必须在事件的每次重复中都保持某些条件的恒定性,以此来保持相关情境的恒定性。在此情形中趋向性又一次类似于力或力场:牛顿的力不是某一事物的特性,而是至少两个事物之间的关系特性;而在物理系统中实际上产生的力总是具有整个物理系统的特性。力和趋向性一样,都是关系概念。
我们往往会忽略趋向性的(例如一次实验组织中的)关系性质:我们会认为在半数硬币抛掷中出现正面或反面的趋向性是硬币的固有特性。但事实上,与其说这是硬币的特性,不如说这是硬币抛掷的特性。从这个事实来看,当我们将硬币抛向松软的沙土或泥土地面(这样的话它有可能会直立起来)而非水泥地面时,我们得到的概率就会变低;这表明甚至在这最简单的情形中我们也要考虑好几个实验条件。
回忆一下我们对“p(a,b)”中b——第二个论证——的角色分析结论,我们就会发现这个结论既支持上述观点,也被上述观点所支持。上述观点表明,即便我们将“b”诠释为事件(潜在或虚拟)序列的名字,但我们并不需要承认所有可能的序列:我们唯一需要承认的序列可以被描述为生成特定可能结果的情境重复,它们的特征就是其生成方法,也即实验条件集的生成。
但人们也有可能会误解我的论证,特别是误解本节中的这些观点。他们也许会将之视为某种意义分析的方法:似乎我已经做的或试图在做的事情就是在某种上下文中用“概率”这个词来表示趋向性。我甚至还一度鼓励了这种误解,特别是在前一节中,我提出频率理论部分地是一种错误的意义分析结果,或是一种不完备的意义分析结果。但我并没有打算用另一种意义分析来取代它。这一点很容易就能看出来,因为我的目的是提出一个与牛顿力的假说相类似的新的物理假说(也可能是形而上学假说)。这个假说的内容是,所有实验组织(因此也包括系统的所有状态)都能生成有时可用频率来加以检验的趋向性。这个假说是可检验的,它能被某些量子实验所验证。例如双孔实验(对照《后记》第三卷第18节)就可以说是概率的纯粹统计诠释和概率的趋向性诠释之间的一个关键实验,并能最终判定胜出者为趋向性诠释。
我将在本书的剩余部分详细地讨论趋向性诠释,我希望人们能根据这些讨论来判定趋向性诠释的理论价值。
在本章我将表明,从频率诠释到趋向性诠释的转换,对应从冯·米泽斯、科普兰、瓦尔德和丘奇(也包括我自己)发展出来的数学频率理论到对概率进行新经典的或测度论处理的转换,我认为后者要优于频率理论,不仅从哲学而言如此,而且从纯数学而言也是如此。《后记》第二卷末尾主要论述的是决定论问题,我试图在那里表明,一直阻碍人们自觉接受趋向性诠释的正是对形而上学决定论的信仰。在关于量子论的《后记》第三卷中我将检验趋向性诠释的实用性。在(第三卷)跋中我打算指出,我们可以根据趋向性理论来构造一种新的物理学形而上学——一种物理学新的研究纲领,它不仅统一了旧纲领,而且还将允许我们统一物理学和生物学。