实验性检验及其重复:独立性
所有科学理论都暗含着下述观点:在特定条件下将会发生特定的事件。而所有检验都旨在实现这些条件,并考察在条件实现的前提下我们能否获得反例。为获得反例,检验手段可以是改变理论未作要求的其他条件。(顺带指出,这表明了像“所有东西都是同等的”这样的ceteris paribus[其他方面都差不多]条款是绝对不能增加到理论之中的,因为它将摧毁理论的可检验性。)
这个从根本上说非常明确而简单的实验性检验过程不但可以应用于非概率假说——为术语简便起见,也可称之为“因果”假说,而且它也可以应用于概率假说中。
甚至原先当我拥护概率(物理)假说的频率诠释时我就非常强调上述观点。那时我曾说过,概率假说断言的是事件特性在事件类或序列中的统计分布,而我们可以用检验因果假说的类似方式检验这些假说的断言。
现在我认为,概率假说和因果假说之间的关系以及二者检验方法之间的关系甚至比我原先所想的还要相近:从趋向性诠释的角度来看,很容易就能将因果假说诠释为断言了趋向性等于1(“确定性”)的假说。
这个诠释能够保留因果假说的性质——此性质允许它产生单称预测;这是因为趋向性诠释同样能赋予“单称事件”,即“出现”[occurrence](在《逻辑》第23节论述的意义上)。
因此对于概率假说和因果假说我们的检验方法都是一样的:创造特定的条件,考察在其他条件发生变化的情况下假说能否产生预测的(单称)效果。概率假说预测单称事件将在某种程度的趋向性上得以实现,而我们可以这样来检验这个预测:在指定的条件下重复实验,并考察重复实验中的频率分布。而因果假说也可以通过重复实验来进行检验,在此情形中为了达到验证我们有如下要求:重复检验序列中的结果,其相对频率应当统一(或在实践中应当非常接近统一)。
因此实验性检验就有两方面的内容:其一是改变条件,其二是保持被假说要求的条件不变——而我们在这里关注的正是后者。它是重复实验这个观念中的核心因素。
这些不变的条件定义或描述了将被重复的实验。因此,对于重复实验来说,确保每次重复都遵守规定条件就绝对必要了。而这意味着在实验组织中,早期实验绝对不能影响后期实验。否则后期实验所处的条件就不同了。换言之,重复实验序列的一个必不可少的特性是:早期实验绝对不能对后期实验产生后效。实验必须独立。这是“重复”观念的组成部分之一,而且它与接受检验的假说是概率的还是因果的完全无关。
我们可以用实践术语来说明上述观点:假设我们在实验结束时要读取某个仪表上的读数,而这个仪表由一根在某一范围内摆动的指针构成。如果这个仪表没有上足润滑油,那么它就有可能固定在某个值上,而这就会导致重复实验结束时它的读数和前期实验相同。在此情形中我们就遇到了实验的“后效”或相依性(非独立性)。
因此,如果我们关注的是具有后效的实验(例如布朗运动或机械学习),那么从检验理论的观点而言,我们就应当将那些呈现出后效的实验连同原初实验放在一起,将它们一并视为某个单一实验的一部分,而不是将之视为实验的重复。同时,只有当某一实验完全从起点出发,而且本身包括了后效的影响时,我们才能将之视为真正的重复。
简而言之,重复实验序列中的每一个实验都必须在同样的规定条件下进行,正因如此,实验必须独立,也就是说,序列必须能摆脱后效的影响。
最简概率假说的检验涉及到的正是这个重复的、因此也是独立的实验序列——这和因果假说检验的情形一样。而在这些独立检验序列中,假说所估计的概率或趋向性将交由频率分布来进行检验。(独立序列的频率分布必须是“正态”分布或“高斯”分布;因此它也必须清楚地指明统计检验是否能反驳或验证假说所猜测的趋向性。)
上述意义上的独立性很长时间以来一直都是概率理论的基础概念之一。概率理论是这样来解释这个概念的:后期实验独立于前期实验,当且仅当前期实验不影响后期实验获得某一特定结果的概率,换言之,当且仅当在整个序列中所有实验产生的概率保持一致。
这显然表明了概率相依于实验条件和实验组织。独立性理论有着如下假定——如果后期实验的实验组织和前期实验的实验组织一样,那么实验结果的概率也一样,反之亦然。如果每次实验之后概率都保持不变,那么实验就没有后效,它们不改变条件。
要说得更确切一些的话,上面最后一句应该表述为“它们不改变相关条件”。因为显然,以前所进行过的实验及其特定结果也是“条件”的一部分,这恰如当在伦敦抛掷硬币的时候,婆罗洲正被狂风暴雨所席卷,或是亚历山大城正经历着一场智力上的革命。这里的关键之处在于,这些条件不影响抛掷硬币正面朝上的概率,它们是不相关的:它们不影响特定的和相关的条件集,因此也不影响概率。
因此,某一实验与其他实验或与特定条件是“独立的”,或者不被这些条件所影响,当且仅当这些条件不改变结果概率。在这个意义上不影响结果概率的那种条件,我们称之为“不相关”条件。
借助形式计算语言来定义这些术语非常容易。令a是结果,其概率是我们关注的内容,而b是相关实验条件。那么

将表示下述断言:在条件b的前提下结果a具有概率r。(在趋向性诠释中它的断言如下:条件b产生某一趋向性r以实现结果a。)
现在令c是某一附加条件,比如有关实验在两次早期实验之后进行,而那两次早期实验的结果都是a。那么我们说这个条件c是不相关的,或者说结果a是独立于它的,只要a的概率在条件bc(即两个条件的合取)下与单独在条件b下一样,也就是说,当且仅当

为了表述得更确切一些,我们应当提及b:在此情形中我们说,给定b的前提下a独立于c,而给定b的前提下c和a不相关。
现在我们可以知道,实验或事件的独立性与条件的不相关性是一套相关的术语集,它们表达的是同一个观念。而下述概率计算结论更强调了这一点:如果p(a,b)>0而且p(c,b)>0,那么p(a,bc)=p(a,b)当且仅当p(c,ba)=p(c,b)。用语言来表述就是,给定b的前提下a独立于c(以及给定b的前提下c和a不相关)当且仅当给定b的前提下c本身独立于a(以及给定b的前提下a和c不相关)。所以我们毋需区分独立性和条件的不相关性。