4.1.2 总体方差未知情况下小样本均值的置信区间

4.1.2 总体方差未知情况下小样本均值的置信区间

在实际问题中,总体方差σ2未知的情况居多,我们遇到的更多的实际情况是根据样本估计总体均值,因此具有更大的实用价值。总体方差未知情况下的均值置信区间的讨论分为大样本和小样本。

σ2未知的小样本均值置信区间的讨论中,新的统计量不再服从正态分布,其中总体标准差σ由样本总体标准差S代替。

幸运的是,Excel 2019的CONFIDENCE.T函数简化了运算步骤。CONFIDENCE.T函数使用学生的t分布返回总体平均值的置信区间,置信区间为某一范围的值。样本平均值位于此范围的中心,此范围的上下限为±CONFIDENCE.T。

CONFIDENCE.T函数语法:

CONFIDENCE.T(Alpha,Standard_dev,Size)

CONFIDENCE.T函数语法具有下列参数:

•Alpha:必需,表示计算置信度的显著性水平参数。

•Standard_dev:必需,表示总体标准差。

•Size:必需,表示样品容量。

例4.2 有一批糖果需要对其平均重量进行估计。现随机抽取16个样本,称重(单位:g)如图4-4所示。

图4-4 样本重量

设袋装糖果的重量近似地服从正态分布,求该仓库中货物平均重量在95%置信水平下的区间估计。

【实验步骤】

(1)由于总体方差未知,所以首先得通过函数求样本总体均值“=AVERAGE(A2:H3)”(如图4-5所示)与样本标准偏差“=STDEV.S(A2:H3)”(如图4-6所示)。

图4-5 求样本总体均值

图4-6 求样本标准偏差

(2)利用CONFIDENCE.T函数求t分布的双尾区间点“=CONFIDENCE.T(E5,B8,B5)”(如图4-7所示)。

图4-7 双尾T分布概率值

(3)根据样本平均值计算置信区间的上下限±CONFIDENCE.T(如图4-8和图4-9所示)。

图4-8 置信区间上限

图4-9 置信区间下限

【结论】该仓库中货物平均重量在95%置信水平下的区间估计为(500.45,507.05)。也就是说,以此区间中的任意一个值作为μ的近似值,其误差不大于

这个误差估计的可信程度为95%。

4.1.3 总体方差未知情况下大样本均值的置信区间

由附录,σ2未知的大样本情况下,近似为正态分布,并以样本标准差代替总体标准差,那么均值μ的置信区间为

例4.3 有一批糖果需要对其平均重量进行估计。现随机抽取60个样本,称重(单位:g)如图4-10所示。

图4-10 样本平均重量

设袋装糖果的重量近似地服从正态分布,求该仓库中货物平均重量在95%置信水平下的区间估计。

【实验步骤】

(1)由于总体方差未知,所以首先得通过函数求样本总体均值“=AVERAGE(A2:J7)”(如图4-11所示)与样本标准偏差“=STDEV.S(A2:J7)”(如图4-12所示)。

图4-11 样本总体均值

图4-12 样本标准偏差

(2)通过CONFIDENCE.NORM函数求出区间的半径,双侧置信区间长度为“=CONFIDENCE.NORM(E9,B12,B9)”(如图4-13所示)。

注意:此处用样本标准差代替了总体标准差。

图4-13 求双侧置信区间长度

(3)根据样本平均值计算置信区间的上下限±CONFIDENCE.NORM。其中置信区间上限为“=B11+B14”(如图4-14所示),下限为“=B11-B14”(如图4-15所示)。

图4-14 求置信区间上限

图4-15 求置信区间下限

【结论】该仓库中货物平均重量在95%置信水平下的区间估计为(499.84,503.00)。也就是说,以此区间中的任意一个值作为μ的近似值,其误差不大于1.581 g,这个误差估计的可信程度为95%。