参数的区间估计

二、参数的区间估计

如前所述,点估计是用一个点(一个数)去估计未知参数.有时我们可能只对参数变动的范围感兴趣,这就是区间估计,即用一个区间去估计未知参数,即把未知参数值估计在某两个界限之间.例如,估计明年GDP增长在7%~8%之间,比说增长8%更容易让人们相信,因为给出7%~8%已把可能出现的误差考虑进去了.又如,火箭中某个部件的可靠度估计为0.95,由于可靠度对于火箭发射成功的重要性,仅有这样一个点估计是不够的,需要对于估计的随机性有更明确的描述.如果说“有98%的把握该部件的可靠度在0.93~0.97之间”就稳妥得多.因此,为了度量估计的精度,我们引入区间估计的方法.下面主要介绍正态分布总体的数学期望和方差的区间估计的问题.

1.置信区间的概念

通过分析一个例子来介绍区间估计的方法.

例4 设某建筑材料抗断强度X服从正态分布N(μ,σ2),其中μ未知,σ2已知(σ=0.2),试对总体均值μ作区间估计.

解 在该总体中取一个样本x1,x2,…,xn,易知μ的点估计为img.现在我们要给出μ的一个区间估计,以此体现估计的误差.为此可取一个估计函数

img

它是img的标准化随机变量,具备下面两个特点:首先,u中包含所要估计的未知参数μ(σ已知);其次,因为img,故u N(0,1),显然它与未知数无关.

img

img

设θ为总体的未知参数,img是由样本x1,x2,…,xn给出的两个统计量,若对给定的概率1-α(0<α<1),有

img

则随机区间img称为θ的置信度为1-α的置信区间,img分别称为置信上限和置信下限,α称为显著性水平,通常取值为0.01,0.05,0.10等.

置信区间的意义可以解释如下:如果进行m次随机抽样,每次得到的样本值记为(x1k,x2k,…,xnk),k=1,2,…,m;则得到m个随机区间img,k=1,2,…,m.这m个区间中,有的包含参数θ的真值,有的不包含.当img成立时,这些区间中,包含参数θ的真值的区间大约占100(1-α)%.

对应于已给的置信概率,根据样本观测值来确定未知参数θ的置信区间,被称为参数θ的区间估计.

2.单个正态总体参数的置信区间

正态总体N(μ,σ2)是最常见的分布,现在给出它的两个参数的置信区间.

(1)σ已知时,μ的置信区间

设XN(μ,σ2),其中σ2已知,μ未知,求μ的置信度为1-α的置信区间.由例4的讨论可知

img

例5 某旅行社为调查当地旅游者的平均消费额,随机访问了100名旅游者,得知平均消费额img,根据经验,已知旅游者消费服从正态分布,且标准差为12元,求该地旅游者平均消费额μ的置信水平为95%的置信区间.

img

于是μ的置信水平为95%的置信区间为(77.6,82.4),即在已知σ=12的情形下,可以95%的置信水平认为每个旅游者的平均消费额在77.6元到82.4元之间.

(2)σ未知时,μ的置信区间

当σ未知时,可用统计量t.由于img,采用与上一小节完全类似的讨论,可以得到的μ置信度为1-α的置信区间为

img

例6 某工业公司的生产经理对一项计算机辅助程序很感兴趣,该程序可以用来培训公司的维修职员掌握机器维修的操作.他希望这种计算机辅助方法可以减少培训工人所需要的时间.为了评价这种培训方法,假定管理部门同意用这种新方法对15名职员进行培训,每个职员所需要的培训天数列于表7-13,假定培训时间总体服从正态分布,试对这种程序所需要的平均时间进行估计.(α=0.05)

表7-13 某工业公司15名职员的培训天数

img
img

所以,培训时间总体均值的置信水平为95%的置信区间是50.0957.65天.

(3)σ2的置信区间

设正态总体XN(μ,σ2),且μ,σ2为未知参数,对给定的置信度1-α,求总体方差σ2的置信区间.

设x1,x2,…,xn为来自总体X的样本,样本方差s2可作为σ2的点估计.而且可以根据样本值求出统计量χ2变量

img

显然,χ2变量中包含σ2,且它的分布又与σ2无关,因此可以用变量χ2构造σ2的置信区间.

由χ2分布的特点,对给定的置信度1-α,令

img

例7 某厂生产的钢管直径X-N(μ,σ2),现从该厂生产的钢管中抽取10个,测得其直径分别为(单位:mm)

img

求总体标准差σ的置信度为0.95的置信区间.

解 易得s2=0.03656,(n-1)s2=9×0.03656≈0.329,当1-α=0.95时,α=0.05,查表得img,代入置信区间公式得到σ2的置信度为0.95的置信度区间为

img

即[0.01729,0.12185],所以σ的置信度为0.95的置信区间为[0.13149,0.34907].