参数的区间估计
如前所述,点估计是用一个点(一个数)去估计未知参数.有时我们可能只对参数变动的范围感兴趣,这就是区间估计,即用一个区间去估计未知参数,即把未知参数值估计在某两个界限之间.例如,估计明年GDP增长在7%~8%之间,比说增长8%更容易让人们相信,因为给出7%~8%已把可能出现的误差考虑进去了.又如,火箭中某个部件的可靠度估计为0.95,由于可靠度对于火箭发射成功的重要性,仅有这样一个点估计是不够的,需要对于估计的随机性有更明确的描述.如果说“有98%的把握该部件的可靠度在0.93~0.97之间”就稳妥得多.因此,为了度量估计的精度,我们引入区间估计的方法.下面主要介绍正态分布总体的数学期望和方差的区间估计的问题.
1.置信区间的概念
通过分析一个例子来介绍区间估计的方法.
例4 设某建筑材料抗断强度X服从正态分布N(μ,σ2),其中μ未知,σ2已知(σ=0.2),试对总体均值μ作区间估计.
对应于已给的置信概率,根据样本观测值来确定未知参数θ的置信区间,被称为参数θ的区间估计.
2.单个正态总体参数的置信区间
正态总体N(μ,σ2)是最常见的分布,现在给出它的两个参数的置信区间.
(1)σ已知时,μ的置信区间
设XN(μ,σ2),其中σ2已知,μ未知,求μ的置信度为1-α的置信区间.由例4的讨论可知
于是μ的置信水平为95%的置信区间为(77.6,82.4),即在已知σ=12的情形下,可以95%的置信水平认为每个旅游者的平均消费额在77.6元到82.4元之间.
(2)σ未知时,μ的置信区间(https://www.daowen.com)
例6 某工业公司的生产经理对一项计算机辅助程序很感兴趣,该程序可以用来培训公司的维修职员掌握机器维修的操作.他希望这种计算机辅助方法可以减少培训工人所需要的时间.为了评价这种培训方法,假定管理部门同意用这种新方法对15名职员进行培训,每个职员所需要的培训天数列于表7-13,假定培训时间总体服从正态分布,试对这种程序所需要的平均时间进行估计.(α=0.05)
表7-13 某工业公司15名职员的培训天数
所以,培训时间总体均值的置信水平为95%的置信区间是50.0957.65天.
(3)σ2的置信区间
设正态总体XN(μ,σ2),且μ,σ2为未知参数,对给定的置信度1-α,求总体方差σ2的置信区间.
设x1,x2,…,xn为来自总体X的样本,样本方差s2可作为σ2的点估计.而且可以根据样本值求出统计量χ2变量
显然,χ2变量中包含σ2,且它的分布又与σ2无关,因此可以用变量χ2构造σ2的置信区间.
由χ2分布的特点,对给定的置信度1-α,令
例7 某厂生产的钢管直径X-N(μ,σ2),现从该厂生产的钢管中抽取10个,测得其直径分别为(单位:mm)
求总体标准差σ的置信度为0.95的置信区间.
即[0.01729,0.12185],所以σ的置信度为0.95的置信区间为[0.13149,0.34907].