5.1.2 假设检验的思路
1.假设检验的步骤
首先设想H0是真的成立,然后考虑在H0的条件下,已经观测到的样本信息出现的概率。如果这个概率很小,就表明一个概率很小的事件在一次试验中发生了。而小概率原理认为,概率很小的事件在一次试验中是几乎不可能发生的。这表明事先的设想H0是不正确的,因此拒绝原假设H0,否则,不能拒绝原假设H0。
至于什么算“概率很小”,在检验之前都事先指定,如概率为5%、1%等,一般将其记作α,α是一个事先指定的小的正数,称为显著性水平或检验水平。
一个完整的假设检验过程包括以下几个步骤:
①提出假设;
②构造适当的检验统计量,并根据样本计算统计量的具体数值;
③规定显著性水平,建立检验规则;
④做出判断。
2.两类错误
由于人们做出判断的依据是样本,也就是由部分来推断整体,因而假设检验不可能绝对准确,它可能犯错误。其犯错误的可能性大小也是以统计规律性为依据的,所可能犯的错误有以下两类。
第一类错误:原假设H0符合实际情况,而检验结果把它否定了,这称为弃真错误。
第二类错误:原假设H0不符合实际情况,而检验结果把它肯定下来了,这称为取伪错误。
3.双尾检验和单尾检验
若拒绝原假设H0,那么就相当于备择假设H1可能发生。如果备择假设是H1:μ≠μ0,那么此时称为双尾检验;如果备择假设是H1:μ>μ0或H1:μ<μ0,那么此时称为单尾检验,拒绝域在单侧。若取α=0.05,则zα/2=z0.025,α 称为显著性水平,也称检验水平,也是犯弃真错误的概率。当然,也可以取α=0.01或其他值(通常在0与0.1之间),它反映出犯弃真错误的不同概率。双尾检验、单尾检验的拒绝域如图5.1中的阴影区域所示。
单、双尾检验与原假设和备择假设的对应关系可参看表5.1。
表5.1 单、双尾检验与原假设和备择假设的对应关系
图5.1 双尾检验、单尾检验的拒绝域
4.检验规则
对假设检验问题做出判断可依据两种规则:一是临界值规则;二是p 值规则。
在假设检验的步骤中,当确定了原假设和检验水平后,就要利用样本数据计算统计量的值,确定临界值、接受域、拒绝域。
(1)临界值规则
假设检验中,根据所提出的显著性水平标准(它是概率密度曲线的尾部面积)查表得到相应的检验统计量的数值,其称作临界值,直接用检验统计量的观测值与临界值作比较,如果观测值落在临界值所划定的尾部(称之为拒绝域)内,便拒绝原假设;如果观测值落在临界值所划定的尾部之外(称之为不能拒绝域)的范围内,则认为拒绝原假设的证据不足。
(2)p 值规则
根据样本信息算出统计量的值后,可以借由分布,求出具体样本观测值绝对值的右侧概率的2倍(单尾检验时为1倍),这个概率值被称为p 值,然后通过比较p 值和检验水平α 的大小,来得出结论。如果p 值小于所给定的检验水平,则认为原假设不太可能成立;如果p值大于所给定的检验水平,则认为没有充分的证据否定原假设。
显然,p 值规则和临界值规则是等价的。在做检验的时候,只用其中一个规则即可。
p 值规则较之临界值规则具有更明显的优点:第一,它更加简捷;第二,在p 值规则的检验结论中,对于犯第一类错误的概率的表述更加明确。因此,推荐使用p 值规则,SPSS做假设检验的算法中用的就是p 值规则。
5.显著性水平(检验水平)
小概率事件在单独一次的试验中基本上不会发生,可以不予考虑。
在假设检验中,我们做出判断时所依据的逻辑是:如果在原假设正确的前提下,检验统计量的样本观测值的出现属于小概率事件,那么可以认为原假设不可信,从而否定它,转而接受备择假设。
至于小概率的标准是多大,这要根据实际问题而定。假设检验中,称这一标准为显著性水平,用α来表示,在应用中,通常取α=0.01、α=0.05。一般来说,犯第一类错误可能造成的损失越大,α的取值应当越小。本书中显著性检验的原则是控制犯第一类错误的概率不超过α。