2.7 决定样本量

2.7 决定样本量

介绍完抽样方法后,一个新的问题出现在研究人员面前,那就是“我应该抽取多少个样本才符合要求”?即样本规模的问题。样本规模也被称为样本量,样本量的多少直接关系到样本能否很好地代表总体,过多或过少的样本量都会降低抽样调查的效果。决定样本量的三个因素分别是:抽样方法、抽样成本、抽样误差。表2-4列举了每个因素与样本量之间的关系,请仔细阅读。

表2-4 决定样本量的因素

在估算简单随机抽样的样本容量时,常见的样本量计算公式一般为两个。

当需要估计总体均值时,样本量的公式为:

n=t2×σ2/e2

其中t为置信度水平的临界值,95%的置信度要求t的统计量为1.96;σ为总比标准差,e为抽样误差。

当需要估算总体比例时,样本量公式为:

n=t2×p(1-p)/e2

其中p为总体百分比,t为置信度水平的临界值,e为抽样误差。

由于置信度水平和所容许的抽样误差(e)是调研人员事先确定的,且根据确定的置信度水平,调研人员可以通过t值分布表查出相应的临界值t。而总体的标准差和百分比往往难以事先得到,所以在实际运用中,调研人员往往会利用前人所做的同一总体的调研资料来加以推论。另外,根据公式可以发现,p(p-1)的最大值是当p取值为1/2时,因此即使调研人员无法推测p值,也可以采取p=1/2这一折中办法计算样本量,此时上述公式可变形为:

n=t2/4e2

表2-5所列为不同置信度水平和最大容许误差下的样本量变化

表2-5 样本量变化

续表

总之,样本量的确定需要综合考虑各方面因素,没有一成不变的规定。以下是根据经验列举的常见样本量的类别:

小型调查类,样本规模在100~300之间;

中型调查类,样本规模在300~1000之间;

大型调查类,样本规模在1000~3000之间。[2]