第四节 归纳评价

第四节 归纳评价

从归纳逻辑的历史发展中可看到,归纳法的职能已发生很大变化: 人们不再承认归纳法是发现和证明定律或理论的工具; 二十世纪的归纳逻辑既不是发现的,也不是证明的逻辑。正像皮尔士所指出的,归纳法是检验假说的操作,归纳逻辑只能够根据检验结果对假说作出评价。归纳评价和演绎证明根本不同: 在演绎法中,前提和结论之间存在着逻辑蕴涵或推导关系。前提真,结论便不可能是假的。结论被证明就是说结论的真具有确实性,是无可怀疑的。而在归纳法中,检验结果或证据不管是怎么样的,也不管经过多少次反复检验,都不证实假说是真的。假说只能从证据获得某一程度的支持(support),前提(证据)和假说之间只存在证据支持关系。逻辑蕴涵的性质是很清楚的,对此没有多大的争论。在Frege以后我们已经有了举世公认的初阶逻辑。至于什么是证据支持,却有各种不同的解释。根据背景知识和证据,对假说进行归纳评价有着许多不同的方式,重要的如概率、似然、相关测度(measures of relevance)、置信水平、潜在意外(potential surprise)、“归纳支持”、证认(corroboration)、逼真性等等,几乎每种归纳逻辑或规范方法论都提出自己独特的评价方式。这些不同方式究竟是为执行相同职能而互相竞争的方法,还是各自应用于不同的目标,因而不互相冲突? 或者它们在研究中究竟有没有任何有效的职能? 简言之,归纳支持或证据具有什么性质? 这已成为当代科学方法论的中心问题。

证认和逼真性是波普尔方法论的中心概念。虽然波普尔坚持证认是假说的非归纳评价,但证认和逼真性都是假说所获得的证据支持程度的测度,是波普尔对证据支持关系的一种解释,同他关于科学目的的看法是密切相关的。如果归纳是检验假说的操作,证认和逼真性实际上都是根据观察结果或证据对假说所作的归纳评价,不过应用这些评价方式所希望达到的目标和其他评价方式有所不同罢了。

置信水平是内曼—皮尔逊的N—P逻辑的区间估计对于某一参数的未知真值所作的估计。例如,若认为“区间[T1,T2]包含着参数θ的真值”,那么这种“认为”犯错误的概率为a,这即是显著性水平。也就是说,区间[T1,T2]以1—a的概率包含着参数θ的真值,1—a即是置信水平。通常把区间估计同假说检验区别开来。事实上,寻找最可能包含着一个被测度对象的未知真值的最佳区间的方法也是检验假说(参数θ)的归纳法,因而置信水平也是一种归纳评价。

似然是大约1912年由费希尔首先使用的一个概念。似然函数即是相对于背景知识BK和假说h的证据e的概率:

p(e/h∧BK)

因此它就是删去贝叶斯定理中的先验概率所剩下的东西。费希尔以及近来G. 伯纳德、爱德华兹和哈金都赞成使用似然函数作为归纳支持的测度。一般地说,他们建议给不同假说所赋予的支持度,同相对于给定证据e的这些假说的似然成正比例。在某种意义上,似然函数是大多数归纳评价方式的最小公分母。例如,按照贝叶斯派的观点,给定了证据的假说的后验概率就恰恰是和假说的先验概率相乘的似然比。而在经典假说检验的普通应用中,判别区域是由似然比决定的。像伯恩鲍姆(A.Birnbaum)所指出的,如果只有两个可容许的假说,那么在似然比和错误概率之间就有直接的对应性。问题在于,为什么有利的似然比给假说以更大的支持。这是难以理解的。爱德华兹给予的唯一答案好像是: 似然比代表一个原始的证据支持概念,是只能够显示却不能够表达的。

证据支持的另一种解释是L.J. 柯恩所谓的“归纳支持”。简单地说,归纳支持度是一个假说的“可靠性”(reliability),亦即它的“抗阻证伪的能力”的测度。依柯恩看,一个全称概括“(x)(Rx⊃Sx)”的归纳支持度是这样决定的: 首先把一切检验按照严酷性的次序排列成一个等级系统,这也就是按照其不同的证伪潜能把相关变项依次排列所产生的一切检验的序列。仅当这个全称概括经受了属于这个序列中的检验,并且通过这个序列中开头的一段,它才得到正归纳支持度。如果或者并未进行任何检验,或者这个概括通不过序列中的第一次检验,它便得到零归纳支持。如果已知这个概括至少通过了序列中n次检验的开头i次,它就至少被赋予i/n归纳支持度。如果已知它通过了开头的i次检验,但通不过第i+1次检验,那么不管它通过了多少比第i+1次更严酷的检验,它的归纳支持度恰还是i/n。也就是说,即使根据背景知识和证据,已知这个概括是假的,它还具有正支持。其意思是说: 这个概括具有等于i/n的证伪抗阻力程度。这样,一个具有高度归纳支持的概括即使是假的并且已被确认是假的,依柯恩看,它仍是“可靠的”。这确实是“可靠性”的一种特殊用法。

从对以上几种评价方式的论述中可以清楚地看到: 证据支持可以有各种不同的测度,或者更准确地说,可以有几个不同的证据支持概念。问题在于它们在假说的评价中是否具有重要的作用。一定要弄明白,哪些支持概念在评价中起更重要、更有益的作用。然后才会理解究竟什么是证据支持,假说的支持究竟具有什么性质。

在哲学家中间,对支持的一种最著名的解释就是概率。他们认为证据支持的测度应当是概率的。最普通的概率主义者就是贝叶斯派,他们主张支持即是后验概率,并且能够方便地按照贝叶斯定理计算出来。对假说进行评价的最富有内容的结果就是支持函数的分布。这种主张的代表是卡尔纳普、杰弗里和罗森克莱茨(R.D.Rosenkrantz)。卡尔纳普和杰弗里都避免谈及知识和假说的接受,杰弗里认为只需有分成等级的信念就够了。罗森克莱茨着重分析支持函数,除分析支持的因素,把支持同行为联系起来,并且讨论支持度将要如何修改以外,还认为一切认识上的利益都可以化归为支持,这就是说: 仅仅在一个因素是支持的一部分的程度内,它才合理地对评价发生影响。这样罗森克莱茨就作出了对简单性、说明力、信息量和统计程序的说明。他的说明引起了竞争性的兴趣。他说: “……证据支持就是一切,当且仅当一个理论得到较好支持,是它而不是另一个便被优先选择。”[8]这样,概率主义者主张概率的测定要独立于一切价值,包括认识价值的考虑。概率主义者是经验论者,他们认为假说支持的评价只需要考虑证据,不需要其他。即使在概率主义者承认假说的接受时(例如欣忒卡),同接受有关的唯一因素也只是概率和对证据的量的限制。

概率主义者的支持度是似真性(truthlikeness)的测度,更适当的叫法是确认度。他们相信“错误的风险(risk of error)”是和确认度成反比例地变化着的,因而错误风险的估计与假说的似真性的测度,以及根据这种测度而采取哪一个假说的问题,是密切相关的。可以认为: 同概率演算的要求相符合的置信概率(或确认度)测度,作为表达关于错误风险的判断和有助于期望效用的评价的置信度测度,是很适宜的。的确,置信状态并非总可以用单一的概率测度来表示。这一点可以暂置不论。如果我们把支持度或确认度理解为可以决定行动者相对于他们的背景知识和证据应当采取什么置信状态,此时,概率测度就能够用作确认度或支持度的测度。在这个意义上,确认度有助于决定应当怎样作出错误风险的估计。这样,概率测度对于日常生活和科学研究中假说的评价,无可怀疑地具有重要的作用。但概率远远不等于证据支持的全部内容。还有着其他重要的关于证据支持的概念。

当然,除了工程技术等方面和有关生命财产的问题外,并非一切研究的目的都是要避免任何错误风险而采取具有最高似真性的假说。例如,在对同一个给定问题的不同可能答案之间进行选择时,有时希望得到其证据支持加强到最大限度的答案。波普尔正确地指出,概率不能够是这个意义上的证据支持的测度。因为按照概率主义的支持概念,获得最大支持的假说是可由证据推导出的,亦即不超出证据范围的假说。对给定问题的一切可能答案的析取便是具有最大概率的答案。显然,我们在选择答案时,往往并不选择这种答案,却去选择那些由证据推不出的答案。当然,这并不表明概率作为错误风险的测度和作为决策中决定期望值的一个要素是没有用处的。这只表明它作为另一个意义上的支持测度是不合格的。

波普尔提出他自己的证认测度来代替概率测度。他相信这个测度恰恰指出在一个给定问题的相竞争答案之间进行选择时要加强到最大限度的东西。波普尔提出他的测度的目的是为了决定哪一个假说值得进一步加以检验。莱维不赞同波普尔关于研究目的的看法。他另外提出用期望认识效用(expected epistemic utility)测度作为证据支持的指标。他认为,这些测度是在相竞争的可能答案之间作出抉择以便给所贮存的背景知识增添信息量时有待极大地加强的因素,可供选择的假说将要相对于这些背景知识的汇集而受检验。莱维在《和真理赌博》一书以及他后来的著作中所建议的测度具有Q(h)—q M(h)的形式,这里Q函数是置信概率函数,M函数被他称为决定信息量的概率函数,指标q则是慎重指标。看一眼便会揭露这个期望认识效用函数至少在形式上是所谓相关测度的概括化。相关函数R指在给定背景证据e的条件下证据i对假说h的相关度,可定义为R(i,h,e) =C(h/e∧i) -C(h/e),这样,相关度就是由于给e增添i而导致的h的确认度的增额。在这两个平行的定义中,相对于给定证据的置信或主观概率Q(h),恰恰相当于给定背景证据e和新证据i的确认度C(h/e, i)。但相关测度定q=1,定M(h)的值等于先验概率C(h/e)。莱维却反对把M(h)定为等于先验概率,这是他的期望认识效用测度同概率主义者的相关测度的区别所在。他自己也承认他的这个证据支持概念并不是概率主义的。

重要的是,莱维相信在这个新概念的框架内,可以有希望把简单性、说明力、信息量、可证伪性、概率、真理性等等概念同归纳推理联系起来,方法是把它们都看作决定认识效用的成分; 在其中,有些成分决定于科学家和科学共同体所提倡的研究纲领的限度内,这样,研究知识增长的学者感兴趣的许多课题便可以同属于归纳推理的问题相联系了。

有时人们引进这样一个支持概念: 如果一个假说的支持度足够高,它便应当被“接受”。许多哲学家认为,概率测度除适合于前述同错误风险的估计有关的支持测度外,还适于作为这个意义的支持测度。但是,大家都知道,以这个方式添加到初始汇集K的句子集不能得出一个演绎的闭集(deductivelyclosedset)。因此,为了达到形成新的知识汇集以便用作日后研究的背景知识的目的,我们不能使用这一种“接受规则”。

另一方面,我们却能够用由沙克尔(G.L.S.Shackle)的潜在意外测度导出的接受置信度(degreesofconfidenceofacceptance)测度作为具有以下性质的证据支持测度: 如果h相对于证据的支持足够高,它应当被接受,应当被添加到证据中去。这是和前面两个概念都不同的另一个支持概念。

沙克尔在他的《经济学中的期望》一书中引进潜在意外的概念。令d K(h)为所测定的h相对于K的潜在意外,这个测度要满足以下显著的条件:

(a)如果d K(h) >0,则d K( -h) =0=最小d-值。

(b)如果K+-h,则d K(h) =1=最大d-值。

(c)d K(hvg) =min(d K(h),d K(g))[x对hvg的不相信度应当等于两肢中的最小d-值]。最大值和最小值可以有不同的选择,但这样规定是方便的。注意可允许h和-h同时有最小d-值。

沙克尔也把潜在意外度叫做不相信度。莱维把它叫做拒斥置信度(degreeofconfidenceofrejection)。在沙克尔看来,相信h到一定程度,就是不相信它的矛盾句到那个程度。b K(h) =d K( -h),给定这个条件,b-函项(相信函项)便应当满足以下的要求:

(a')如果b K(h) >0,则b K( -h) =0=最小b-值,

(b')如果K+-h,则b K(h) =1=最大b-值。

(c')b K(h∧g) =min(b K(h),b K(g))。

[x对h∧g的相信度应当等于两肢中的最小b-值]。

注意: 可允许h和-h同时有最小b-值,莱维把满足这些要求的测度叫做接受置信度测度。

假定行动者X开始有背景知识和资料的汇集K(可用语句的演绎闭集来表示的)。他要通过增添满足某一问题所产生的需要的新信息量来扩充这个汇集K。令U为相对于K穷尽而相斥并且每个都同K相容的假说h1,h2,……,hn的有限集。对所研究问题的一个可能答案可作为增加一个假说h(给定K,这个h等值于Ⅴ的元素的某些子集的析取)和构成演绎闭合Kh的一个实例。共有2n个可能的答案。相对于K,X必须认可这些答案中的一个。

现在令b K(h)高于某一门限值。由于d K( -h) =b K(h); 并且按照条件(c),如果把-h表示为U的一个子集的元素的析取,d K( -h)便等于给-h的一个析取肢测定的最小d-值,同时,当假说的d-值较特定的门限值大时,它们便被拒斥; 于是,-h就被拒斥,正如-h的析取肢的一个子集的一切析取都被拒斥一样。但这就等于主张h被接受。正像k和h的每一个推断都被接受一样。而且h和每一个这样的推断都有大于门限值的B-值。这样,概率测度在用作“接受规则”意义上的支持测度时所受关于演绎闭合问题的困扰就并不使b-测度苦恼。

为了接受或拒斥假说而使用b-测度时,一个有足够高的b-值的假说被添加到证据中去,关于它的真值问题的研究就结束了。同样地在一个假说的d-值足够高时,它就被拒斥,而它的否定被添加到证据中去,研究又再次结束。在结束前的证据或背景知识K的充分性成为结束的根据。这证据的“加权值”足够对这个假说作出决定性的判决。正是在这个意义上我们能够用b-函项(或d-函项)来评估凯恩斯所说的论证的加权值。

这样看来,沙克尔的潜在意外测度把非概率性的和符合于构成系统以前的某些先行概念的不相信度(和相信度)概念保存起来了。按照置信度或主观概率来诠释这个前系统的相信概念是错误的。例如当我对里根将再次当选美国总统的假说持不可知论态度时,这个假说的b-值和d-值便都是零,亦即b(h)和b( -h)都等于零。尽管这个测度不符合概率演算,却是对归纳推理有用的。所以这里有两个不同的“置信度”或“相信度”概念。我们不应当把主观概率和以接受为基础的相信度(b-测度)混淆起来。潜在意外测度并不和概率测度竞争,它在思虑和研究中起了和概率互相补充的作用。它们各自有不同的适用范围。

总括起来,关于证据支持有许多不同概念和许多不同的测度。它们是否有用和是否重要取决于它们在思考和研究中的作用多大和有无作用。上面论述了几个比较重要的支持测度,特别是概率测度、认识效用测度和以接受为基础的相信度测度。它们所要解决的是不同的任务,似乎都不可偏废。试图用其中之一作为唯一测度代替一切其余的测度将是错误的。通常的错误就是仅仅注意概率解释而忽视其他的支持概念。至少有三个不同的支持概念对假说的归纳评价具有重要的作用。归纳支持问题的解决不在于以一个测度代替其他的测度,却在于辨别它们各自的职能和适用范围。


[1] 穆勒: 《逻辑系统》,第3卷,第1章,第2节。

[2] 休厄尔: 《新新工具》,第115页。

[3] 巴特(Robert E.Butls) 编: 《休厄尔关于科学方法的理论》(William Whewell's Theory of Scientific Method),匹兹堡大学出版社1968年版,第159页。

[4] 吉尔雷: 《科学知识的认识论根源》,见《归纳、概率和确认》,《明尼苏达科学哲学丛刊》第Ⅵ卷,1975,第226页。“CSU”是“chanceset-up”(机遇布置)的缩写。

[5] 博丹编: 《小亨利·基伯格和艾萨克·莱维侧影》,第220页。

[6] 博丹编: 《小亨利·基伯格和艾萨克·莱维侧影》,第212页。

[7] 见《小亨利·基伯格和艾萨克·莱维侧影》,第213页。

[8] R.D. 罗森克莱茨: 《认识决策论》,见博丹编《局部归纳》,1976年版,第74页。