六、概率推理

六、概率推理

(一)概率逻辑

概率逻辑是一种形式化、数量化的归纳逻辑。基本特点是运用现代的逻辑与数学工具,主要是数理逻辑与概率统计理论,对归纳逻辑、归纳方法进行形式化、数量化的研究。

1.古典概率

古典概率是在某些特殊情况下,利用研究对象的物理或几何性质所具有的对称性确定概率:任给原子命题P(c)和模型的论域A,|A|=n,而且A中的个体是否具有属性P的概然性相等,如果A中有m个个体有属性P, n—m个个体没有属性P,则称原子命题P(c)(为真)的古典概率为m/n。

例如:质地相同的硬币是对称的,正面和反面的概然性相同,因此正面和反面的概率都是1/2。再如:排除其他因素,生男生女的概率也是1/2。重庆市的电话号码是8位数,是由1—10中的任意8个数字构成的,因此任何人要想拨对一个号码的概率是1/108。

2.相对频率

若集合S由n个元素构成,其中m个有属性P, n m个没有属性P,则我们称S中的元素具有P的相对频率是m/n。

例如:

天鹅a1是白的,a2是白的,a3不是白的……天鹅a n不是白的,n个天鹅中有m个白的,n m个不是白的。

则“天鹅是白的”在S={a1,……,an}(为真)的相对频率是m/n。再如:

如果随机事件A在K次试验中分别有如下的统计:次数n1,n2,……,n k, A事件相应的出现m1,m2,……,m k次,A事件试验的概率可以得到m k/n k。

如果试验次数越多,频率始终在某一个数上下摆动,这就是事件A的频率,表示为P(A)=P。

例如:

投掷硬币,其正面概率可能性靠几次投掷来确定是不可能的,当我们试验次数上升,概率波动越小。历史上有人作过试验的统计,这一统计说明实验次数越多,正面朝上的可能性越接近1/2。

统计如下表:

figure_0112_0005

需要注意的是,随机事件A发生的概率不同于A发生的频率。频率是在一个试验组得到的比值,概率则是在K组试验后得到不同频率值的稳定值。概率是至少几个频率值才能确定。

在我们不知道概率知识之前,随机事件就是偶然出现的事件,我们对这类事件出现往往从质的方面分析,凭经验来断定其真假。随机事件的出现是有规律可寻的,运用概率和统计规律,我们可以预测可能出现的事件的概率,利用概率知识分析鉴定结论可能性的大小,准确地对物证进行同一识别,提高鉴定的科学性。在侦查过程中,利用概率推理还可以帮助警察从不同概率的判断中进行合理选择,准确确定犯罪嫌疑人。

3.警察对现场观察的结论表现为对物证及其关系的陈述命题

陈述分为:为真的陈述,为假的陈述,可能的陈述。可能陈述是介于真和假之间的命题,这类陈述有一个可能性大小的问题,特别是鉴别两个客体物是否同一的时候,如DNA鉴别、指纹鉴别以及现代声纹、体味鉴别等,都存在一个概率问题。

(二)概率推理

用某类事件部分事件的频率推导出该类事件概率的推理。其推理形式为:

S1是P;

S2是P;

S3不是P;

……

Sn不是P;

S1 Sn是S类部分对象;

n个S中有m个S是P;

S是P概率是m/n

例如:

观察了1 050只天鹅,发现其中有1 000只是白色的,只有50只是黑色的,我们可以推出世界上所有的(或下一次观察到)黑色天鹅的概率是1/21。

这样的概率推理显然要比简单地肯定“所有的天鹅是白色的”(在观察中没有遇到黑色天鹅),或者简单地否定“所有的天鹅是白色的”(当遇到黑色天鹅)要好得多,也更容易被人接受。

概率推理是从部分对象A所具有P性质的频率推导出A类事物具有P性质的概率,从部分推导出整体,结论显然是或然性的。比如犯罪后重新犯罪率为30%~40%就是一个概率,它是统计的结论,具体到一个国家或地区可能并不一样。我们知道DNA数据库就是依据有30%~40%的重新犯罪概率建立的,当数据库里存储了犯罪分子的DNA数据后,我们才能从现场发现的DNA检材与数据库资料进行比对,这样做的目的是有效地震慑再次犯罪的人群,对串案并案也能起到积极作用,从而节省警力,提高侦查的效率。

DNA鉴定专家邓亚军曾这样评价DNA鉴定中的概率问题:DNA鉴定99.99%的准确率是通过概率计算得到的。因为使用的STR标记首先是要有一个人群统计学的数据,比如说一个人的STR在某一个位点的分型,比如是10或者是11,而另外一个人在这一点的分型和他一样的几率是多少?然后综合多少个位点得出来的一个统计学数据。因此,根据统计学数据来定,它不可能是一个100%的数据,只可能是无限接近100%。可以精确到99.999%,一直到9循环,这个0.01的不准确性只是跟概率有关,概率统计上不可能有100%。