三、分层抽样
分层抽样是一种卓越的随机抽样方式,又称分类抽样或类型抽样。分层抽样是先将总体的单位按某种特征分为若干次级总体(层),然后再从每一层内进行简单随机抽样,组成一个样本。分组减小了各抽样层变异性的影响,抽样保证了所抽取的样本具有足够的代表性,可以提高总体指标估计值的精确度。
分层抽样的具体程序是:把总体的单位分成两个或两个以上的相互独立的完全的组(如男性和女性),从两个或两个以上的组中进行简单随机抽样,样本相互独立。总体的单位按主要标志加以分组,分组的标志与研究者关心的总体特征相关。如某酒厂正在进行有关啤酒品牌知名度方面的调查,初步判别,在啤酒方面,男性了解的知识与女性不同,那么性别可以是划分层次的适当标志。如果不以这种方式进行分层抽样,分层抽样就可能得不到什么效果。
分层抽样与简单随机抽样相比更有优势,因为它有显著的潜在统计效果。也就是说,如果从相同的总体中抽取两个样本,一个是分层样本,另一个是简单随机抽样样本,那么相对来说,分层样本的误差更小。另外,如果抽样的目标是获得一个确定的抽样误差水平,那么更小的分层样本将达到这一目标。
通常,分层抽样一般有3个步骤。
第一,辨明突出的(重要的)人口统计特征和分类特征,这些特征与所研究的行为相关。例如,研究某种产品的消费率时,按常理认为男性和女性有不同的平均消费比率。为了把性别作为有意义的分层标志,调查者肯定能够拿出资料证明男性与女性的消费水平明显不同。用这种方式可识别出各种不同的显著特征。调查表明,一般来说,识别出6个重要的显著特征后,再增加显著特征对于提高样本代表性并没有多大帮助。
第二,确定在每个层次上总体的比例(如性别已被确定为一个显著的特征,那么总体中男性占多少比例,女性占多少比例呢?)。利用这个比例,可计算出样本中每组(层)应调查的人数。
第三,调查者从每层中抽取独立简单随机样本。分层抽样的特点就是先将总体按照某种特征或指标分成几个排斥的又是穷尽的子集或层,然后在每个层内按照随机的方法抽取元素。其原则是子集内元素间差异可能很小,而不同子集间差异很大。分层抽样的样本的结构与总体的结构比较相近,通过此方法,既可以对总体参数进行估计,也可以对各层的目标量进行估计等。
适用场景:适用于层间有较大的异质性,而每层内的个体具有同质性的总体。如在进行消费倾向调查时,按年龄将调查人口分为老年人、中年人、青年人3类。总调查人口为6000人,其中老年人1000人,中年人2000人,青年人3000人。如果需要采用分层抽样的方法从中抽取200人,应如何确定样本的分布呢?