第3章 抽 样
样本(Sample)是从总体中抽出的一部分个体。样本中所包含的个体数目称样本容量或含量,用符号N或n表示。样本有大小之分,大样本(Large Sample)的容量一般在30以上,小样本(Small Sample)的容量在30以下。一般而言,样本越大从总体中提取的信息就越多,对总体的代表性就越好,因此一般情况都抽取大样本进行研究。
抽样又称取样,是指从待研究的总体中抽取一部分个体作为样本,对这些样本进行分析、研究以此来估计和推断总体特性的过程。抽样是科学实验、质量检验、社会调查普遍采用的一种经济有效的工作和研究方法,抽样的基本要求是要保证所抽取的样本对总体具有充分的代表性。样本作为总体的缩影,因此选取样本的过程必须非常谨慎,否则就会对总体的判断造成很大的偏差。
1936年,民主党人罗斯福担任美国总统期满,共和党人兰登与他竞选总统。当时著名的杂志《文学摘要》组织大约240万人参加了预测谁是下一任总统的民意测验,结果预测兰登将以57%对43%的优势获胜。当时《文学摘要》杂志影响力很大,自1916年之后的连续五届总统选举中,《文学摘要》杂志都正确地预测出获胜的一方。而当时名不见经传的盖洛普刚刚成立盖洛普民意调查研究所,他们根据一个约5万人的样本得出了不一样的结论,预测罗斯福会以56%对44%的优势获胜。
在这次竞选总统的预测调研中,《文学摘要》杂志样本远远大于盖洛普民意调查的样本量,那么是不是样本数大结果就更加准确呢?实际的结果却是,罗斯福以62%对38%的优势胜出。从常理来看,《文学摘要》调查的样本量比盖洛普高达几十倍,样本越多,结论不是应该更可靠吗?罗斯福的实际得票率为62%,《文学摘要》杂志的预测为43%,误差达到19%。《文学摘要》杂志的大样本调查为什么反而出现更大的误差呢?
后来经过研究发现,出现偏差的主要原因在于《文学摘要》杂志选取样本有偏性。《文学摘要》杂志是根据电话簿和俱乐部会员的名册,将问卷邮寄给1 000万人。当时美国四个家庭中仅有一家装电话,这样《文学摘要》杂志选取的样本有排斥穷人的选择偏性,所以《文学摘要》杂志的民意测验非常不利于民主党人罗斯福,结论出现了比较大的偏差。此外,《文学摘要》杂志调查的1 000万人中只有240万人回答了问卷,不回答者可能非常有别于回答者,这240万人代表不了被邮寄问卷的1 000万人。所以当出现不回答率偏高的时候,谨防不回答偏性。
因此,我们在进行抽样时,必须充分考虑样本对总体的代表性。明确调查对象总体的内涵和外延,选择恰当的抽样方法,最后还需评估样本质量。