6.1.3 抽样术语
在前面的介绍中可能已经涉及一些大家还不清楚的概念,例如总体、样本、抽样误差,等等。这些概念都和抽样方法有关,因此在介绍抽样方法之前,先解释一些与抽样方法有关的专业术语。
大家都知道,抽样调查的目的在于通过对样本的调查说明一个比较大的总体的情况。因此,在抽样之前,首先要确定在什么范围内抽样,如何确定范围的大小,被抽取的调查对象应该有多少,调查对象的数量能否达到说明总体某一变量的可信度和精确度。我们需要了解一些基本的专业术语,例如总体和样本、抽样框、抽样误差、置信度和置信区间、参数值和统计值等,否则有些内容就无法理解。
6.1.3.1 总体和样本
所谓总体就是构成总体的全部单位或元素,这些单位或元素在调查研究中可以是个人,也可以是群体或组织甚至是社区。例如,研究某城市大学生的生存和发展以及他们的价值观念,构成总体的单位或元素就是个人,即大学生;调查国有企业和非国有企业的生产和管理方式以及生产效率,此时构成总体的单位或元素就是企业,即组织;调查不同类型的家庭结构对子女教育的影响,此时构成总体的单位或元素就是家庭,即群体;我们要调查北方农村和南方农村的村庄宗族活动,此时构成总体的单位或元素就是村庄,即社区。由于现代社会调查大多数是以个人为分析单位,因此,在很多情况下,构成总体的基本单位或元素是个人。
从总体中按照随机方法抽取出来作为收集资料的对象,就是样本,因此样本是总体的一部分。按照概率理论,被抽取出来的样本是可以代表总体的。例如,如果在2006年某城市全部大学生中抽取1000名学生作为调查对象,这1000名学生就是样本。
总体实际上就是研究对象的范围,有着具体的时空界限,是可以界定的。通常一个总体包括三大要素,即地域(地点)、时间和对象。例如,我们是在2006年调查某城市大学生,那么总体就是2006年某城市全部大学生(具体的规定见6.1.4.1) 。在抽样调查中之所以对总体进行严格的规定,在于通过样本调查所得到的数据或结论只能推论到样本所在的总体,而不能推论到总体以外的情况。就如上例,通过对某城市1000名大学生的调查,所得到的数据或结论,就不能说明2005年的该城市大学生的情况,也不能说明其他城市或全国大学生的情况。这种对推论的严格规定,显然要比其他调查方法严谨得多。
6.1.3.2 抽样框和抽样单位
抽样框就是根据总体的具体规定(时间、地点、对象)所包含的全部单位或元素的名单,也可以称为抽样范围。对于抽样框的一个通俗说法就是“花名册”。例如,上述关于某城市大学生的调查,它的抽样框就是2006年全部在校大学生的名单。如果当时的大学生有50万名,且从大学生中直接抽样,从理论上说,必须把全部大学生的名单都要搜集到,建立一个“花名册”,然后按一定方法抽样[1]。显然,以个人为单位的抽样框只能适合于总体比较小的情况,因为对于一个比较大的总体,在制定抽样框时,很难避免总体的一些单位或元素被丢失的可能[2]。
因此,在一个比较大的总体中抽样时,例如,一个国家、一个省或某个大城市,根据我国现有的条件,一般采用多阶段抽样的方法。即在总体中分成几个阶段抽样,分别建立几个抽样框。例如,关于某城市大学生调查的抽样,可以建立三个抽样框:第一级抽样框是全部大学;第二级抽样框可以是学院,即在被抽取的大学中,收集所含学院的全部名单;第三级抽样框是大学生,即在全部被抽取的学院中,收集全部大学生的名单。
在抽样过程中要确定抽样单位是什么。抽样单位就是在一次抽样中具体使用的单位。在以个人为单位的总体中,若在总体中直接抽取个人,它的抽样单位就是个人。但是在多阶段抽样中,由于要制定多级抽样框,它们的抽样单位是不同的。按上例,从第一级抽样框到第三级抽样框,抽样单位分别是学校(组织)、学院(组织)和大学生(个人)。由此可见,抽样单位与构成总体的单位或元素有时是一致的,有时是不一致的。显然,若在个人为单位或元素的总体中直接抽样,抽样单位和构成总体的单位或元素是一致的,而多阶段抽样时,抽样单位和构成总体的单位或元素只是在最后一级的抽样框中才是一致的。
前面曾经介绍过分析单位和调查对象,它们和抽样单位之间的关系是怎样的呢?应该说,抽样单位有的时候和分析单位、调查对象是一致的,有时候是不一致的。例如,在一所大学里进行有关大学生就业意愿的抽样调查,并且直接在大学生中抽样,此时分析单位、调查单位和抽样单位是一致的,都是大学生,即个人。如果调查课题变成该大学理科学生和文科学生就业意愿抽样调查,采取以班级为单位的整群抽样方法,此时抽样单位就是班级,即群体,分析单位是不同专业的学生,即群体,调查对象是大学生,即个人。因此,抽样单位和分析单位、调查对象之间的关系,要根据调查课题的特点和具体的抽样方法确定。
6.1.3.3 参数值和统计值
参数值是指总体中某个变量的数值,即总体值;统计值是指样本中某个变量的数值,即样本值。它们分别是关于总体或样本某个变量的综合描述。例如,某大学共有10000名学生,通过对全部大学生的调查,男生和女生的比例为100∶108,即每100名女生,就有108名男生;若从10000名学生中抽取500名学生进行调查,男女性别比为100 ∶ 105,即每100名女生,就有105名男生。100∶108就是这所大学即总体性别比变量的综合描述;100∶105就是调查样本性别比变量的综合描述。
问题在于,为什么有了参数值后还要有统计值?显然两种数值的获取方法是不同的。参数值必须对总体的所有单位或元素进行调查以后才能得到,即所谓的普遍调查之后才能得到;统计值来自于对样本的调查结果。由于调查研究的特殊性,其中的很多变量值是不可能通过对总体全部单位的调查而获得的。因此,对于这类数据通常是采用抽样调查的方法而得到的。例如,上例关于大学生就业意愿的调查,如果在一所大学进行的话,也许可以采取普遍调查的方法获得有关大学生就业意愿的有关信息:工作地点、职业选择、工作要求、行业选择、薪金期望、单位性质、择业观念等。但是,如果要做一个省、一个直辖市,甚至全国范围的普遍调查,不仅难度很大,成本很高,不易获得比较深入的资料,而且也没有必要。因此,通常采用抽样调查的方法收集相关数据。但是,通过抽样调查获得的数据并不仅仅是用来描述样本的情况,更为重要的是说明样本所在总体的状况。因此,抽样调查的一个重要作用就是可以运用统计方法,为样本的统计值推论总体的参数值提供条件。
虽然,参数值和统计值都是有关某个变量的综合描述,都是一个具体的数值,但是两者有着重要的区别:参数值是唯一的、不变的;统计值是可变的、多样的。对于一个确定的总体来说,关于某个变量的参数值只有一个。例如上述有关大学生就业意愿调查中性别比,在总体(一所大学)中是100 ∶ 108。只要你的调查中没有发生遗漏,调查所获的资料是正确的,哪怕进行多次调查,这个变量值也是不会变的。但是,抽样调查则不同,因为抽样调查可以从总体中抽取无数个由500名学生组成的样本,每次调查得到的性别比数值都会发生变化,都会围绕100∶108而上下波动。其次,参数值通常是未知的(除非进行普遍调查)、统计值是可以通过样本调查而得到,是已知的,未知的总体参数值只能由样本统计值的推论才能成为已知。
6.1.3.4 置信度和置信区间
参数值经由统计值推论获得,那么参数值的准确性和可信度如何呢?例如,在观看世界杯决赛时,人们对于A队和B队之间的胜负会有自己的判断:甲同学认为A队战胜B队的可能性是80%,并且会以2 ∶ 1胜出;乙同学认为B队战胜A队的可能性是90%,并且会以2∶0胜出。两位同学所讲的“胜率”可以大致理解为置信度,对于两队之间比分的判断大致可以理解为置信区间。
因此,置信度是指总体参数值落在样本统计值某一区间内的概率,也称为置信水平;置信区间是指在一定的置信度下,样本统计值和总体参数值之间的误差范围。置信度反映的是推论的可信度或可靠性,置信区间反映的是推论的准确性。例如,上例大学生就业意愿抽样调查中有关家庭平均月收入的统计值是5000元。在统计推论中,对于参数值的估计,即参数估计,通常是采用区间估计的方法。经由标准误的计算,统计值的区间如果是4500~5500元,此时,总体参数值落在4500~5500元的可能性假如为95%,95%就是置信度,4500~5500元就是置信区间。在此例中,我们可以说,通过抽样调查,该大学大学生家庭月平均收入落在4500~5500元区间的概率是95%,也可以说,我们有95%的把握认为,该大学大学生家庭月平均收入是4500~5500元区间内的任意数值。在95%的置信度下,样本统计值和总体参数值之间的误差为10%。
由图6-2可知,M即为平均值, -SE~+SE即为置信区间,由-SE到+SE在正态曲线上所包含的全部面积即为置信度;同理, -2SE~+2SE也为置信区间,由-2SE到+2SE在正态曲线上所包含的全部面积为置信度。可以看出,一方面,置信区间越小,误差越小,参数值的准确性就越高;反之,则越低。置信区间在正态曲线图上所对应的面积越大,置信度就越高,即可靠性就越大;反之,则越小。另一方面,置信度和置信区间之间存在着对应或相互影响的关系,即被推论的参数值的准确性越高,即置信区间越小,它的可靠性,即置信度就越低;反过来,被推论的参数值的准确性越低,即置信区间越大,它的可靠性,即置信度就越高。因此,人们通常在置信度和置信区间的选择上采取折中的方法。置信度和置信区间的高低和大小对样本规模都具有直接或间接的影响。
6.1.3.5 抽样误差、标准误和非抽样误差
置信区间被认为是在一定的置信度下,样本统计值和总体参数值之间的误差范围,实际上已经含有对抽样误差的解释。抽样误差是指当用样本统计值推论总体参数值时产生的偏差。由于抽样调查是部分调查,相对于总体来说,样本是总体的组成部分,是局部的。因此,任何抽样调查都会存在或大或小的抽样误差,不管它的样本有多大。在抽样调查中,研究者可以事先规定抽样误差的大小,常用的抽样误差可以规定为1%, 5%, 10%等,大于10%的抽样误差对抽样调查来说意义不大。在抽样调查中,还存在系统误差或非抽样误差,其中包括度量误差,它主要发生在测量、记录、填答、汇总等过程中,或者是指标设计有误以及一些人为的差错,如观察不当、造假、回答不实等。抽样误差是客观存在的、不可避免的,但可以通过扩大样本降低抽样误差,但不可能归零;而非抽样误差是主观的,是可以避免的,它可以通过我们的工作降低到最低程度,也可以通过一些技术方法发现和修正。
由于抽样误差主要受到总体的差异性或分布方差和样本规模的影响。因此,对实际上存在的抽样误差的估计通常是标准误(标准误差),即本章所讲的总体标准差除以。由于总体标准差实际上是不可能知道的,因此只能以样本的标准差代替总体标准差。标准误(标准误差)是直接影响置信区间大小的一个因素。如图6-2所示,SE代表一个标准误,2SE代表2个标准误,3SE代表3个标准误。