3.2.2 样本大小的计算方法

3.2.2 样本大小的计算方法

从上述分析中可以看出,影响样本容量的因素是多方面的,但必要样本容量是根据抽样误差、抽样极限误差和概率度推算出来的,在不同抽样方式下,计算公式有所差异。

1.简单随机抽样重复抽样的样本容量

简单随机抽样是指按照随机原则从总体单位中直接抽取若干单位组成样本。简单随机抽样分为简单重复抽样和简单不重复抽样,因此,简单随机抽样的样本容量计算公式包括两种。在重复抽样条件下,样本容量的计算公式又分为总体标准差已知和总体标准差未知两种情况。

(1)总体标准差已知情况下的样本大小

总体标准差已知时,估计均值需要的样本大小计算公式为

例3.8 某产品销售商希望通过抽样方法从购买该商品的顾客中进行抽样,已知顾客对价格总体估计的标准差为8,需要估计的价格误差不超过3元,试分别确定在0.05和0.1的显著性水平下需要抽样的人数。

【实验步骤】

步骤1:在E1单元格输入“0.05”。

步骤2:计算给定显著性水平对应的区间点,在B4单元格输入“=NORM.S.INV(E1/2)”。

步骤3:根据样本公式进行计算,在B5单元格输入“=B4 2*B1 2/B2 2”。

实验结果n为27,即在0.05的显著性水平下需要抽取27人,结果如图3-25所示。

图3-25 计算0.05显著性水平下的抽样人数

步骤4:把E1单元格中的“0.05”改为“0.1”,则实验结果n为19,即在0.1的显著性水平下需抽取19人,结果如图3-26所示。

图3-26 计算0.1显著性水平下的抽样人数

显著性水平的数值越小,需要抽取的样本数越多;反之显著性水平数值越大,需要抽取的样本数相对较少。

(2)总体标准差未知情况下的样本大小

总体标准差未知时,可以用样本的标准差代替总体的标准差,来近似地确定需要样本的大小。在正式抽样前先进行一次简单的抽样,确定出一个样本的标准差,然后根据公式确定出抽样样本的大小后再进行正式的抽样和分析。

例3.9 某产品销售商希望通过抽样方法从购买该商品的顾客中进行抽样,总体消费金额的总体标准差未知,在正式抽样前首先进行了一次预抽样,调查了30名顾客的情况,结果如图3-27所示。需要估计的价格误差不超过3元,试确定在0.05的显著性水平下需要抽样的人数。

图3-27 某产品顾客样本数据

【解题步骤】

步骤1:计算样本标准差,在B8单元格输入“=STDEV.S(A2:J4)”。

步骤2:计算区间点,在B10单元格输入“=NORM.S.INV(B6/2)”。

步骤3:根据公式计算样本容量,在B11单元格输入“=ROUNDUP(B8 2*B10 2/E6 2,0)”。

实验结果n为35,即在0.05的显著性水平下需抽取35人,结果如图3-28所示。

图3-28 0.1的显著性水平下的实验结果

注意:步骤3中的ROUNDUP函数表示向上舍入。

2.简单随机抽样不重复抽样的样本容量

在不重复抽样条件下,样本容量的计算公式为

这里,N代表样本总数。

同样的,总体标准差未知时,可以用样本的标准差代替总体的标准差,来近似地确定需要样本的大小。

3.分层随机抽样的样本容量

分层随机抽样,也称类型随机抽样,是指首先将调查对象的总体单位按照一定的标准分成各种不同的类别(或组),然后根据各类别(或组)的单位数与总体单位数的比例确定从各类别(或组)中抽取样本的数量,最后按照随机原则从各类(或组)中抽取样本。

对于分层抽样,在总的样本量一定时,一个重要的问题是各层应该分配多少样本量。实际工作中有不同的分配方法,可以按对各层进行常数分配,也可以按各层单位数占总体单位数的比例分配,还可以采用在总费用一定条件下使估计量方差达到最小的最优分配等,其中等比例分配是较为常用的方法。

分层抽样是对每一组抽样,不存在样本组间误差,抽样平均误差取决于各组内方差的平均水平,即以各组样本单位数为权数,计算各组内方差的平均数。因此可用组内方差平均数计算出抽样平均误差。

(1)重复抽样时的样本容量

在重复抽样条件下,样本容量的计算公式为

在以上公式中是组内平均方差其中ni代表各组样本单位数代表各组的组内方差,n代表样本总数。

(2)不重复抽样时的样本容量

在不重复抽样条件下,样本容量的计算公式为

(3)各层样本量的确定

当样本容量n确定之后,各层应抽取的样本单位数可采用等比例法进行分配,计算公式为

式中,ni为第i层应抽取的样本数,n为样本容量,N i为第i层样本数,N为总体单位数。

4.整群随机抽样的样本容量

整群随机抽样又称聚类抽样,是把总体先分为若干个子群,然后抽取若干群作为样本单位的一种抽样方式。整群抽样是对选中的群进行全面调查,所以只存在群间抽样误差,不存在群内抽样误差,因此抽样平均误差可根据群间方差推算出来。由于整群抽样一般是不重复抽样,故应按不重复抽样计算必要的抽样群数。

由整群抽样的极限误差和抽样标准误差公式导出样本容量计算公式为

上式中P r代表成数的群间方差代表群间方差,其中 是第i群样本平均数,是全样本平均数,r是抽取的群数。

5.等距抽样样本容量

等距抽样可分为三类:按有关标志排队、按无关标志排队以及介于按有关标志排队和按无关标志排队之间的按自然状态排列。

(1)按无关标志排队的等距抽样

若对总体采用按无关标志排队的等距抽样时,可采用简单随机抽样的公式确定等距抽样的样本容量。由于等距抽样一般都是不重复抽样,应采用在不重复抽样条件下样本容量的计算公式。

(2)按有关标志排队的等距抽样

若对总体采用按有关标志排队的等距抽样,则可采用分层抽样的样本容量公式确定样本容量。但应注意有序系统抽样的样本容量计算所需的平均组内方差应根据以往的资料做出估计。