常用的统计量的分布

三、常用的统计量的分布

1.X2分布(卡方分布)

定理4 设X1,…,Xn是独立同分布的随机变量,而每一个随机变量服从标准正态分布N(0,1),则随机变量img的分布密度为

img

其中img是伽玛函数在img处的值.这种分布称为自由度为n的χ2分布,记为χ2(n).随机变量χ2称为χ2变量.

证明略(采用数学归纳法).

χ2分布的密度图形如图7-4所示.它随n取不同的数值而不同.

img

图7-4 χ2(n)分布密度函数

当χ2~χ2(n)时,对给定的α(0<α<1),称满足img)是自由度为n的卡方分布的1-α分位数,分位数img可以从数学用表中查到.

χ2分布具有下列性质:

img

这个性质称为χ2变量的可加性.

证明略(采用数学归纳法).

定理7 设χ2~χ2(n),则对任意x有

img

此性质说明n很大时,img近似服从标准正态分布,亦即自由度n很大的χ2分布近似于正态分布N(n,2n).

2.t分布

定理8 设随机变量X服从标准正态分布N(0,1),随机变量Y服从自由度为n的χ2分布,且X与Y相互独立,则

img

这种分布称为自由度为n的t分布,简记为t(n),它亦称学生(St udent)分布,随机变量T简称T变量.

现在计算n→+∞时,t分布密度的极限.

img

其中最后一个等号由Γ函数性质获得.计算结果表明,当n→+∞时t分布密度趋于标准正态分布密度.

t分布的密度函数的图像是一个关于纵轴对称的分布,与标准正态分布的密度函数形状类似,只是峰比标准正态分布低一些,尾部的概率比标准正态分布的大一些.

注:(1)自由度为1的t分布就是标准柯西分布,它的均值不存在;

(2)n>1时,t分布的数学期望存在,且为0;

(3)n>2时,t分布的方差存在,且为img

(4)当自由度较大(如n≥30)时,t分布可以用N(0,1)分布近似.

t分布是统计学中的一类重要分布,它与标准正态分布的微小差别是由英国统计学家哥塞特(Cosset)发现的,哥塞特年轻时在牛津大学学习数学和化学,1899年开始在一家酿酒厂担任酿酒化学技师,从事实验和数据分析工作,由于哥塞特接触的样本容量都比较小,只有四五个,通过大量的数据积累,哥塞特发现img的分布与传统认为的N(0,1)分布并不同,特别是尾部概率相差比较大.

由此,哥塞特怀疑是否有另一个分布族存在,通过深入研究,哥塞特于1908年以“Student”的笔名发表了此项研究成果,故后人也称t分布为学生氏分布,t分布的发现在统计学史上具有划时代的意义,打破了正态分布一统天下的局面,开创了小样本统计推断的新纪元.

当随机变量T~t(n)时,称满足{T≤t1-α(n)}=1-α的t1-α(n)是自由度为n的t分布的1-α分位数,分位数t1-α(n)可以从数学用表中查到.

由于t分布的密度函数关于0对称,故其分位数间有如下关系:

img

3.F分布

定理9 设X和Y分别服从自由度为m,n的χ2分布,且X与Y相互独立,则

img

这种分布称为第一自由度为m,第二自由度为n的F分布,或自由度为(m,n)的F分布,记为F(m,n).随机变量F简称F变量.

当随机变量F~F(m,n)时,对给定α(0<α<1),称满足(F≤F1-α(m,n))=1-α的F1-α(m,n)是自由度为m与n的F分布的1-α分位数.

4.样本均值img和样本方差S*2的分布

来自一般正态总体的样本均值img和样本方差S*2的抽样分布是应用最广的抽样分布,下面我们加以介绍.

定理10 设X1,…,Xn是来自正态总体N(μ,σ2)的样本,其样本均值和样本方差分别为

img
img

证明略.

推论

img