质量控制的统计学基础

第一节 质量控制的 统计学基础

一、统计质量控制的实践意义

统计质量控制(Statistical Quality Contral,SQC)又称统计过程控制,是指应用统计方法对过程中的各个阶段进行监控与诊断,从而达到改进与保证检验结果质量的目的。SQC强调全过程的监控。SQC对于刑事技术实验具有非常重要的意义,对实验室管理者而言,可用SQC消除在检验鉴定过程中检验人员与质量管理人员之间的矛盾;对于实验操作者而言,可用SQC控制检验结果的质量,减少重复检测,减少浪费,能够提高工作效率和质量。通过统计质量控制,刑事科学技术实验室可以提高检验结果的准确度和精密度,为侦查、起诉和审判提供证据。

二、质量控制的内容

正确选用检验方法是保证检验工作质量的前提之一,实验室应优先采用国家发布的最新有效的标准方法,也可选择国际或权威文献发布的方法或自行研制的方法等。采用非标准的方法时,方法可靠性的确认可采用标准物质或与权威方法比对或进行实验室之间比对的方法。因此,实验室质量控制可分为内部质量控制(Internal Quality Control,IQC)和外部质量控制(External Quality Assessment,EQA)。实验室在检验之前,需要对样本进行正确的采集,按要求进行保存和运输。在检验过程中,往往按照一定频率定量地检测稳定样品中某种或某些成分,并将测定值标在符合一定统计学规律的控制图上,运用设定的判断限或控制规则对控制图上的测定值(也称控制值)进行评估,以此推测同批次样本的检测质量是否在控。为了确定某实验室具备进行某项特定检测/校准的能力,需参加实验室间比对来进行验证,这一活动过程称为能力验证(Proficiency Test,PT)。质量控制的内容既包含了分析前的准备,检验过程中的质量监控,又包括实验室间的质量评价。

三、与质量控制相关的几个统计学概念

(一)总体与样本

1.总体

总体(Population)是指特定研究对象中所有观察单位的测量值。总体通常限定于特定的时间和空间范围之内,为有限数量的观察单位,称为有限总体;有时总体是假设的,没有时间和空间限制,观察单位是无限的,称为无限总体。

2.样本

从总体中随机抽取部分观察单位,其测量结果的集合称为样本(Sample)。样本应采用随机抽样的方法获得。

(二)变量与资料

研究者在研究总体之后,应对每个观察单位的某项特征进行测量和观察,这种特征能表现观察单位的变异性,称为变量(Variable)。对于变量的测得值称为变量值或观察值,由变量值构成资料(Data)。变量的观察结果可以是定量的,也可以是定性的。按变量属于定量或定性的类型,可将资料分为以下几种类型:(https://www.daowen.com)

1.计量资料

用定量的方法测定观察单位中某项指标量的大小,所得的资料称为计量资料,其变量值是定量的,表现为数值大小,计量资料一般都有度量衡单位。计量资料亦称定量资料或数值变量资料。

2.计数资料

将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料,其变量值是定性的,表现为互不相容的属性或类别,如试验结果的阴性或阳性,计数资料又称为定性资料或无序分类变量资料。

3.等级资料

为将观察单位按某种属性的不同程度分组,所得各组的观察单位数称为等级资料,又称为半定量资料或有序分类变量资料。其变量值有半定量性质,表现为等级大小或属性程度。如显色反应、凝集反应的程度可根据反应强度分为-、±、+、++、+++、++++六级。

(三)频率与概率

1.频率

一个随机试验有几种可能的结果,在重复进行试验时,表面看来是偶然发生的,但当重复次数足够大时,总有某种规律性出现,在重复多次实验后出现某种结果的比例称为频率(Relative Frequency)

2.概率

概率,又称或然率、机会率、机率(几率)或可能性,是概率论的基本概念。概率是对随机事件发生的可能性的度量,一般以一个在0到1之间的实数表示一个事件发生的可能性大小。越接近1,该事件越可能发生;越接近0,则该事件越不可能发生。

概率(Probability)是描述随机事件发生可能性大小的一个度量。设在相同条件下独立重复做n次实验,随机事件A出现f次,则称f/n为随机事件A在n次试验上出现的频率,当实验次数逐渐增多时,频率f/n始终在一个常数左右做微小摆动,则称该常数为随机事件A的概率,可记为P(A)。在实际工作中,当概率不易求得时,只要观察单位数足够多,可将频率作为概率的估计值。但在观察单位数较少时,频率的波动性较大,由频率估计概率是不可靠的。

随机事件概率的大小介于0与1之间,即0≤P≤1。P越接近于1,表示事件发生的可能性越大;P越接近于0,表示事件发生的可能性越小;P=1表示事件必然发生,称为必然事件;P=0表示事件不可能发生,称为不可能事件。P=0和P=1这两类事件具有确定性,不是随机事件,但可作为随机事件的特例。习惯上将P≤0.05称为小概率事件,表示在一次实验或观察中,事件发生的可能性很小,可视为很可能不发生。

(四)均数

均数(Mean)是最常用的一个统计量,对样本中所有个体的值计算总和后除以个体数即可求得,常用X表示,它往往集中反映一个样本的特征。

(五)标准差

标准差(Standard Deviation,SD)反映样本中个体的离散程度,是表示变异常用的统计量,常常以SD表示。

(六)变异系数

变异系数(Coefficient of Variation,CV)是表示变异的统计指标,它是标准差相对于平均数的百分比,以CV表示。在定量检测中,往往用变异系数来表示检测方法的不精密度。

(七)正确度

正确度(Trueness)指同一实验室用同种方法在多次独立检验中分析同一样品所得结果的均值与靶值之间的差异。偏倚可以用来表示正确度。

(八)精密度

精密度(Precision)是指在一定条件下进行多次测定,所得结果之间的符合程度。精密度也无法直接衡量,而以不精密度表示,测定不精密度的主要来源是随机误差,以标准差(SD)和变异系数(CV)具体表示。SD或CV越大,表示重复测定的离散程度越大,精密度越差;反之则越好。

(九)准确度

准确度(Accuracy)指实验室用某种方法在多次独立检验中分析某样品所得各个结果值与靶值之间在一定置信区间内的最大值。准确度既包括正确度又包括精密度,或者说测定结果由随机误差和系统误差及偏倚分量组成。

(十)控制品

控制品(Control Material)是专门用于质量控制目的而且特性明确的物质,其含量已知或未知并处于与实际样本相同的基质中。

(十一)正态分布

正态分布(Normal Distribution)也称高斯分布,理想的正态分布表现为呈对称的钟型曲线(见图4-1)。当重复多次测量同一样本时,所得到的该组结果不可能全部一样,而是呈现出“两头小、中间大”的正态分布规律。通过统计学方法,可以求得该组数据的平均数(图示)和标准差(s),这两个统计量与正态分布曲线下面积(数据点的分布)符合下述统计学规律:以图示为中心,左右各1个s范围内的正态曲线下所包含的面积约占曲线总面积的68%,换言之,对于符合正态分布的一组数据,约68%的数据点应落在图示±1s之间;以此类推,图示±2s的范围内应包含约95%的数据点,图示±3s的范围内应包含约99.7%的数据点。不同的数据集合里图示和s的大小不同会导致正态分布曲线形状的改变,但前述规律却是一致的,这一规律是质量控制工作的统计基础。

图示

图4-1 正态分布曲线