四、整群抽样
以上各种抽样类型全部是按单位抽取的,即按样本单位数,一个一个地抽取。而在整群抽样中,样本是按一组单位一组单位地抽取。也就是将总体中若干个单位合并为群,抽样时直接抽取群,然后对群中的所有个体全部实施调查。整群抽样有两个关键步骤:第一,同质总体被分为相互独立的完全的较小子集;第二,随机抽选子集构成样本。
如果调查者在抽中的子集中观察全部单位,这样就有了一级整群样本。如果在抽中的子集中再以概率方式抽取部分单位进行观察,那就有了二级整群样本。分层抽样和整群抽样都要将总体分为相互独立的完全子集。它们的区别是,分层抽样的样本是从每个子集中抽取的,而整群抽样则是抽取部分子集。整群抽样只需群的抽样框,可简化工作量,同时调查的地点相对集中,缺点是估计的精度较差。
地理区域抽样是整群抽样的典型方式。挨家挨户去调查一个特定城市的调查者也许会先随机抽选一些区域,然后集中地访查这个区域中的某些群体,这样就能大量减少访问时间和经费。整群抽样被认为是随机抽样,因为它可以随机抽出群和单位。值得注意的是,在整群抽样下,需要假定群中单位与总体一样存在异质性。
整群抽样可以和其他抽样方式结合起来使用,如首先将总体划分成许多相互排斥的子总体或群,然后以群为初级抽样单元,按某种随机抽样方式,如简单随机抽样,从中抽取若干个群,对抽中的群内的所有单元都进行调查。也就是先把总体中的个体划分成称作群的单个组,总体中的每一个个体属于且仅属于某一个群,再以群为单位抽取一个简单随机样本。当群中的个体不同质时,整群抽样得到的结果最佳。在理想状态下,每一个群是整个总体小范围内的代表。整群抽样的值依赖于每一个群对整个总体的代表性。如果所有的群在这个意义上是同质的,则抽取小量的群就可以得到较准确的关于总体参数的估计。
整群抽样适用于群间差异小、群内各个个体差异大,可以依据某种特征差异来划分的群体。
实例3-2:某市统计部门现需调查某城市居民户的经济情况,要抽取2000个样本。假定该市共有1000个居委会,每一个居委会平均涉及100户居民。这样,就可以居委会为单位,采用纯随机抽样方式抽出20个居委会,共2000户,然后把这20个居委会涉及的2000户居民视为样本进行调查。
整群抽样和前文讨论的分层抽样有一些区别:分层抽样分成的各类彼此之间差异明显,但每类内部差异不大,整群抽样的群间彼此差异不大,但每群之内差异明显;分层抽样中的每类都是按一定比例抽取的样本,而整群抽样是从总群中抽出若干群。