警务信息研判中的统计推理及其类型和特征
警务信息研判是为了对大数据形式的警务信息进行分析以作出判断,进行解释、预测和辅助决策,其中常用的定量和或然性推理就是统计推理。统计推理是统计学与推理相结合的结果。一般而言,统计学分为统计调查、统计估值和统计检验,其中的统计估值就是从样本以某统计数值具有某种属性推出总体也可能以该统计数值具有该属性,是统计推理的一种常见类型。这里的“统计数值”包括比率、比例、百分比、均值等可以定量描述对象属性的数学变量。
(一)警务信息研判中的统计推理的含义
警务信息研判人员在考察关于某一特定时期、区域、人群等的大数据信息中的对象时,发现大数据中有些对象具有某属性,有些对象不具有该属性,这时显然不能断言所有对象都具有(或者不具有)该属性。但是,如果断言“有对象具有某属性”,那么对结论的精确化描述就显然不足。在这种情况下,警务信息研判人员可以通过对具有该属性的对象数统计,根据它们在被考察对象中所占比例,推出所有对象也可能有相应比例的成员具有该属性。这里运用的推理就是统计推理。
统计推理就是从某样本(或者总体)以某个统计数值具有某种属性,推出总体(或者另一样本、另一个体)也可能以该统计数值具有该属性的一种或然性推理。在警务信息研判中,统计推理具有如下作用:
1.应用统计推理求出总量、平均数和加权值
应用统计推理求出总量是指在被考察对象总体中区分出各个层次,然后在各个层次中各选出一定数量的样本,计算出这些样本的相关数量,然后推出各层的数量,最后根据一定比例求出被考察对象的总量。应用统计推理求出平均数是指在被考察对象的总体中进行选取,计算出样本具有某种属性的均值,然后利用统计推理,推出被考察对象总体也以该均值具有该属性。应用统计推理求出加权值是指将样本中某个体成员的每个计数值与其权重相乘后在相加后得到的数值。在求加权值的过程中,从各个方面或者对象各个层次中抽取分层样本,计算出它们的相关数量,然后再推及各方面或者各个层次的相关数量。
在警务信息研判中,应用统计推理求出总量、均值和加权值,可以让警务信息研判人员判断一定时期、一定区域、一定领域内的某种情况的性质、现状、趋势,以便公安机关的相关职能部门有针对性地、及时地进行预判和作出决策。
2.应用统计推理得出统计结论
统计推理的结论是一个统计判断,它不是全称判断或者普遍性概括,也不同于特称判断。特称判断的形式是“有S是P”。因为“有”的上限可以是全部,而下限是1,所以特称判断的量词“有”是一个很宽泛的范围。这虽然有利于扩大特称量词“有”的适用范围,但是不能精确地、定量地刻画到底“有多少S是P”。在警务信息研判中,有一个样本具有某种属性、极少样本具有某种属性、近半样本具有某种属性、多数样本具有某种属性、绝大多数样本具有某种属性、乃至几乎所有样本具有某种属性——它们对于公安工作的意义和价值是不同的。因此,只有对得出的判断进行定量化、精确化的刻画,公安机关的相关职能部门才能采取适时的、可行的措施。而统计推理的结论是一个统计判断,这客观上有利于警务信息研判人员形成对某种情形属性的定量认识。
3.应用统计推理解释案情事实
在侦查思维中,统计推理可以用于解释某案情事实。这就是所谓的归纳统计模式。侦查解释的归纳统计模式是指统计规律和相关条件陈述以较高概率推出待解释的案情事实。如果以L表示统计定律,C表示相关条件陈述,E表示待解释的案情事实,那么侦查解释的归纳统计模式的结构形式可以表示为:
C(相关条件陈述);
L(统计定律);
所以,E(待解释的案情事实)。
这里的统计定律要么以特称判断“大多数S是P”的形式出现,要么以统计判断“X%的S是P”的形式出现。
例如,在一次侦查讯问中,侦查人员发现某犯罪嫌疑人总是拒不坦白。为什么该犯罪嫌疑人不坦白呢?根据以往的侦查讯问经验,侦查人员得出一条统计定律:绝大多数(近88.7%)的惯犯由于熟悉侦查程序、反侦查手段和法律法规中的漏洞,在侦查讯问中极不配合,总是极力为自己辩解,或者拒不坦白,一副“死猪不怕开水烫”的架势,以图逃避法律制裁。而经过进一步查阅该犯罪嫌疑人的违法犯罪及被处理记录,侦查人员发现该犯罪嫌疑人就是一个惯犯。这样,该犯罪嫌疑人不坦白案情的事实得到了合理解释。基于此,侦查人员及时调整思路、转变方法,进行耐心细致的攻坚战,找到了促使该犯罪嫌疑人坦白的突破口,攻破了该犯罪嫌疑人的心理防线,终于使得该犯罪嫌疑人放弃幻想、认清形势、坦白交代。
(二)警务信息研判中的统计推理的类型
在警务信息研判中,广义的统计推理有多种类型:从总体到样本的推理、从样本到总体的推理和从样本到样本的推理。狭义的统计推理就是指统计概括推理。本文采用广义的统计推理。
1.统计概括推理
统计概括推理是指根据某类对象的样本以某个统计数值具有某种属性,推出该类对象的总体可能也以该统计数值具有该属性。这种统计推理的实质是从样本到总体的推理,是统计方法与枚举推理的结合形态,也是统计推理的最主要类型。例如,某公安派出所警务信息研判人员发现,该所刑侦中队在一年来侦破的刑事案件中,涉嫌“两抢一盗”的15名犯罪嫌疑人中的8名是父母离异且家庭经济条件很差的青少年。所以,可能涉嫌“两抢一盗”的犯罪嫌疑人近半数是父母离异且家庭经济条件很差的青少年。
统计概括推理的结构形式可以表示为:
被考察的样本S’以某统计数值具有属性P;
S’是总体S中选取出来的样本;
所以,可能总体S中也以该统计数值具有属性P。
人们之所以进行统计概括推理,主要是因为对象的数量过大甚至无限,以至于不必要也不可能逐一或者全部加以考察,只能抽取一定数量的样本进行考察,将样本具有的属性推及总体。
2.统计类比推理
统计类比推理是指根据某类对象的样本以某个统计数值具有某种属性,推出具有相似甚至相同属性的另一样本可能也以该统计数值具有该属性。这种统计推理的实质是从样本到样本的推理,是统计方法与类比推理的结合形态。
统计类比推理的结构形式可以表示为:
被考察的样本S’以某统计数值具有属性P;
另一样本S’’在很多属性上与样本S’相似甚至相同;
所以,可能样本S’’也以该统计数值具有属性P。
3.统计三段论
统计三段论是指根据某类对象的总体以某个统计数值具有某种属性,推出该类对象的样本可能也以该统计数值具有该属性。这种统计推理的实质是从总体到样本的推理,是统计方法与直言三段论的结合形态。
统计三段论的结构形式可以表示为:
被考察的总体S以某统计数值具有属性P;
S’是总体S中选取出来的样本;
所以,可能样本S’也以该统计数值具有属性P。
(三)警务信息研判中的统计推理的特征
1.统计推理基于前提的结论是或然的
无论是哪种统计推理,无论其前提对结论的支持度多高,即使其前提是真实的,其结论也不是必然真实的。在统计概括推理中,总体中成员的数量不小于样本中成员的数量,统计概括推理结论的断定范围极易超出其前提的断定范围,其前提对于结论的支持不是决定性和保证性的:即使前提全部真实,结论也仅是或然的。统计类比推理的前提对于结论的支持仍然不是决定性的。也就是说,即使其前提都真,结论也仅仅是可能真,达不到必然真。为了提高其结论的可靠性,要遵守类比推理的全部规则。统计三段论的实质是将总体的统计属性推及其样本或者个体。事实上,由于总体中成员具有某属性的比例很难达到100%,属于它的样本或者成员就可能落在具有该属性的对象范围之外。因此,统计三段论的结论仍然是或然性的。
正因如此,统计推理的结论是一个或然性判断,不是一个必然性或者实然性判断。这在一定程度上表明了统计推理结论的可错性。
2.统计推理对属性的陈述是定量的
统计推理借助于统计学的方法、概念乃至术语,对对象具有某种属性进行定量的描述,有利于人们的认识精确化。统计推理虽然是对枚举推理的定量化描述,但是已经不同于枚举推理。枚举推理虽然便捷易用,但是未经选样,仅仅以同类对象具有某种属性的这类事实的不断重复和数量积累为依据;而统计推理的前提需要经过选样。因此,统计推理对其考察的对象是经过了一定的选择的。在这个意义上,统计推理经过了简单的试验,对数据进行了初步的分析、筛选和整理,归纳强度可能更高,得到的结论可能更加可靠。
在当前“互联网+”背景下,借助于大数据技术和云计算手段,统计推理不仅可以进一步实现对象属性定量描述的精细化、相关化和整合化,而且可以实现前提对结论支持度刻画的数学化、定量化和精确化。