二、系统抽样
系统抽样是指先将总体中的抽样单元按某种次序排列,在规定范围内随机抽取一个初始单元,然后按事先规定的规则抽取其他样本单元。如果在抽取初始单元后按相等的间距抽取其余样本单元,则称为等距抽样。等距抽样适用于容量很大且个体的排列是按照随机顺序排列的总体。在使用系统抽样时,调研人员首先选取1个随机的起点,然后连续地在抽样框架中每隔i个个体再选出其他样本。其选取样本的间隔i被称作抽样间距。它是由总体大小N除以样本量的结果四舍五入后得出的。如假设总体中共有100000个个体,样本量大小为1000。在这一情况下,抽样间距为100,即从1至100之间随机选择一个数字。如果选取的第一个数字是23,那么样本就包括个体23、123、223、323、423、523等。
在使用系统抽样方法时,调研人员通常会按照某一方式把总体中的个体进行排列。如果电话簿被用作抽样框架,其中的个体就会被按照首字母顺序进行排列。在一些情况下,这一顺序也许与调研人员感兴趣的某些特征有关。例如,调研人员可能会按照未偿还余额对信用卡使用者进行排列,或按照年销售额对某一行业内的公司进行排列。当调研人员按照与某些被调研的特征有关的方式对个体进行排列时,利用系统抽样获得的抽样结果可能与利用简单随机抽样获得的抽样结果存在很大的不同。如果对1份按销售额递增顺序排列的公司名单进行系统抽样,那么所得到的样本既包括大型公司也包括小型公司。相比之下,利用简单随机抽样所得到的样本就缺乏代表性。例如,在使用简单随机抽样时,调研人员所得到的样本可能只包含小型公司,或者包含较少数量的小型公司。
在使用系统抽样时,如果抽样框架被设计成循环结构,那么其样本的代表性就会降低;假如使用系统抽样,从包含60年以来每个月月销量的抽样框架中可以产生1个商场月销量的抽样,如果抽样间隔为12,那么最终的抽样则不会反映月销量的变化情况。
系统抽样比简单随机抽样更加经济和简单,因为随机选择的过程只有1次。此外,系统抽样也不需要了解抽样框架的构成。例如,每第i个离开商场的顾客都可以被拦截。由于以上原因,系统抽样经常被应用于顾客邮件、电话和商场拦截式访谈。
实例3-1:某学校学生的学号以高考成绩高低排列,第一名为01,第二名为02……该学校需要做一次全校性的针对某次考试模拟卷难易度调查,抽取班级学号尾号为1的学生作为样本。
由于序号并非完全按照一种连贯的规则确定,这样的取样规则最终得到的数据结果一定会呈现某种程度的偏差,研究者在做调研时需要警惕类似的偏差。