3.2 市场调查资料收集的方式
3.2.1 全面调查
一、全面调查的含义与方式
(一)全面调查的含义
全面调查又称普查,是对调查对象的全部单位无一例外地逐个进行的调查,是一种专门组织的一次性调查。如我国国家统计局组织的人口全面调查,就是对全国的每个人都进行的调查。
全面市场调查的目的就是了解市场的一些至关重要的基本情况,对市场状况作出全面、准确的描述,从而为企业制定市场营销计划提供可靠的依据。如对某类商品的库存量、供货渠道以及消费对象的全面调查,都是为了掌握某种市场现象在一定时点上的整体情况而专门组织的一次性全面市场调查。
全面调查规模的大小取决于调查对象中所包含的个体单位的多少。全面市场调查在实际应用中有宏观、中观和微观之分。也就是说,并不一定所有的全面市场调查都是在全国范围来做,也可以在地区和部门范围内做,甚至可以在企业中做。只要是对调查对象全部单位逐个进行调查,都可以称为全面市场调查。如高校为了全面了解本校大学生的消费状况,就可以在本校内组织全面调查,对所有的学生无一例外地进行调查。
(二)全面调查的方式
全面调查有两种方式:一种方式是由上级制定调查表,由下级根据已经掌握的资料进行填报,如我国的工业全面调查;另一种方式是组织专门的调查机构,派出专门的调查人员,对调查对象进行直接登记,如我国的人口全面调查。
【小资料】
人口全面调查的特征
人口全面调查是指在国家统一规定的时间内,按照统一的方法、统一的项目、统一的调查表和统一的标准时点,对全国人口普遍地、逐户逐人地进行的一次性调查登记。人口全面调查工作包括对人口全面调查资料的搜集、数据汇总、资料评价、分析研究、编辑出版等全过程,它是当今世界各国广泛采用的搜集人口资料的一种最基本的科学方法,是提供全国基本人口数据的主要来源。
人口全面调查具有普遍性。作为全国人口全面调查来说,这个地域范围指的是一个国家的范围。例如,国务院发布的《第五次全国人口全面调查办法》中规定的地域范围是指“中华人民共和国境内”。一般在这个地域范围内常住的人,都应被调查到。人口全面调查的特征如下:
第一,调查组织的高度集中性。它是国家统一组织的,按国家法定的全面调查方案协调进行的专门性调查。
第二,全面调查对象登记的全面完整性。全面调查对象包括某一地域内的全部人口。
第三,调查登记的直接性。须按每个人的实际情况,以便取得每一全面调查对象的原始资料,并逐项填报登记。
第四,登记时点的标准性。要按照严格规定的同一标准时刻进行登记。
第五,要按照现代化的统计原理、原则和方法,制定统一的、科学的全面调查纲要和调查方法。
二、全面调查的实施要点
为了保证全面调查工作的有效性,组织全面调查时必须注意以下几点:
1.调查项目要简明、统一。
进行全面调查时,需要调查的对象多、范围广,组织工作比较复杂,参与调查的人员也较多,所以调查项目不宜过多,应该简明具体。如我国在1953年进行的第一次人口全面调查,调查项目只有姓名、与户主的关系、性别、年龄、民族、地址六个项目。后来随着现代信息技术的发展,调查项目才有所增加。同时,每个项目都应该有明确的操作定义、统一的计算公式,这样便于进行准确的调查和统计分析。
2.调查时间要统一。
组织全面调查时,必须统一规定调查资料所属的标准时点,避免调查资料出现重复或遗漏。
3.正确确定调查期限、选择登记时间。
为了提高资料的准确性,一般应选择在调查对象变动较小或登记、填报较为方便的时间,并尽可能在各全面调查地区同时进行,力求在最短时间内完成。
4.尽可能按一定周期进行。
全面调查工作尽可能按照一定的周期进行,并保持内容的一致,以便于对历次全面调查资料进行对比和分析,研究现象的发展趋势及其规律性。
三、全面调查的优点与局限性
1.全面调查的优点。
全面调查的优点在于调查所得的资料具有全面性和准确性,因而,全面调查就成了了解全国、全省、全市和全县市场情况的最重要方法。
2.全面调查的局限性。
全面调查的局限性在于:一方面,全面调查的工作量大、花费大,组织工作异常复杂,而且时效性差。另一方面,调查的内容有限,只能调查一些最基本、最一般的现象,而且很难进行深入细致的研究。
在市场调查中,全面调查的应用范围较窄,适应性较小,很少用于大范围的市场调查,只适用于某些小范围的市场调查。例如,商业批发企业对供应地区内的零售商店进行某种商品需要量的全面调查。
3.2.2 重点调查与典型调查
一、重点调查
(一)重点调查的含义
重点调查是一种为了解社会经济现象的基本情况而组织的非全面调查。它是从所要调查的全部单位中选择一部分重点单位进行调查,借以从数量上说明总体的基本情况。所谓重点单位,是指这些单位在全部总体中虽然数目不多,所占比重不大,但就调查的标志值来说却在总量中占很大的比重,对全局起决定性作用。通过对这部分重点单位的调查,可以从数量上说明整个总体在该标志总量方面的基本情况。如想了解我国棉花生产的基本情况,就可以通过对山东、江苏、湖北、河北、河南五个重点产棉区的棉花产量进行调查。再如想了解全国钢铁生产的基本情况,通过对首都钢铁公司、鞍山钢铁公司、包头钢铁公司、武汉钢铁公司、上海宝山钢铁公司、攀枝花钢铁公司等几个重点钢铁公司的调查就能掌握。可见,重点调查的优势在于调查的单位不多、花费的力量不大,却能了解到对全局有决定影响的基本情况。
(二)重点单位的选择
进行重点调查,关键的问题是要选好重点单位。
首先,重点单位的多少要根据调查任务而确定。一般来说,选出的单位应尽可能少些,而某标志值在总体中所占的比重应尽可能大些。其基本标准是所选出的重点单位的标志值必须能够反映出所研究总体的基本情况。
其次,选择重点单位时往往存在如下情况:在某一问题上是重点单位,在另一个问题上不一定是重点单位;在某一调查总体中是重点单位,在另一调查总体中不一定是重点单位;在这个时期是重点单位,在另一个时期不一定是重点单位;重点之中又有重点等。这就要求针对不同的调查需要,认真选择每一次调查的重点单位。
最后,选中的单位应是管理健全、统计基础工作较好的单位。
(三)重点调查的优缺点
重点调查的优点是花费力量较小,能及时提供必要的资料,便于各级各类部门掌握基本情况,采取措施。
但重点调查取得的数据只能反映总体的基本发展趋势,不能用以推断总体,因而也只是一种补充性的调查方法。目前主要是在一些企业集团的调查中运用。如为了掌握“三废”排放情况,就可选择冶金、电力、化工、石油、轻工和纺织等重点行业的工业进行调查。
二、典型调查
(一)典型调查的含义
典型调查也是一种非全面调查,它是从众多的调查研究对象中,有意识地选择若干个具有代表性的典型单位进行深入、周密、系统的调查研究,以达到了解总体的特征和本质的方法。进行典型调查的主要目的不在于取得社会经济现象的总体数值,而是在于了解与有关数字相关的具体情况。例如,铅笔的生产厂家想了解铅笔的需求情况,就可以在主要使用铅笔的中小学生中选择若干具有代表性的学校或班级,调查这些学校或班级的学生在一学期或一年中人均购买多少支铅笔,再根据全国中小学生数便可推算出全国每年铅笔的大致需求量。
(二)典型调查的类型
典型调查适用于调查总体同质性比较大的情形。同时,它要求研究者有较丰富的经验,在划分类别、选择典型上有较大的把握。一般来说,典型调查有两种类型:一种是一般的典型调查,即对个别典型单位的调查研究。在这种典型调查中,只需在总体中选出少数几个典型单位,通过对这几个典型单位的调查研究说明事物的一般情况或事物发展的一般规律。另一种是具有统计特征的典型调查,即将调查总体划分为若干类,再从每类中选择若干典型进行调查,以说明各类的情况。
【小资料】
典型调查的步骤
实施典型调查的主要步骤是:根据研究目的,通过多种途径了解研究对象的总体情况;从总体中初选出备选单位,加以比较,慎重选出有较大代表性的典型;进行调查,具体搜集资料;分析研究资料,得出结论。
(三)典型调查的优缺点
典型调查的优点在于调查范围小、调查单位少、灵活机动、具体深入,节省人力、财力和物力等。其不足是在实际操作中选择真正有代表性的典型单位比较困难,而且还容易受人为因素的干扰,从而可能会导致调查的结论有一定的倾向性,且典型调查的结果一般情况不能严格推及总体,只能大体反映同类事物的本质和变化趋势。
【小资料】
固定样本连续调查
1.固定样本连续调查的含义。
固定样本连续调查也是一种非全面调查,是从调查对象的全部单位中抽取出一部分单位,组成固定样本,在一定时间内,通过对固定样本的连续调查来测定市场发展变化的趋势。如居民消费情况、储蓄情况、产品使用情况、商品购买情况和广告收拾情况等。在实践中,我国的城市居民家庭生活调查、农村居民家庭生活调查、西方国家的住房调查等都采取固定调查户(样本)进行连续调查。
固定样本连续调查的调查对象可以是消费者,也可以是销售者(零售商或批发商),还可以是生产者。消费者固定样本连续调查以居民家庭为调查对象,调查消费者需求的变化及购买行为、收入支出、消费结构等变化情况;零售商固定样本连续调查以零售商企业为调查对象,调查零售销售量、商品结构、价格水平、费用、利润等的变化情况;批发渠道、费用、批零差率、利润等的变化情况;固定样本连续调查以生产企业为调查对象,调查产品成本变化的因素和趋势,为制定价格提供可靠资料。
2.固定样本连续调查的形式。
固定样本连续调查的方法有:在一定时间内定期与样本户进行个别面谈或问卷调查;向消费者分发购物日记簿,由消费者详细填写,然后由调查者定期回收汇总,这种方法称为消费者日记调查法。调查者定期到消费者活动场所进行直接的观察、记录,或通过机械(录音机、照相机、摄像机等)进行记录观察,这种方法称为观察调查法。
3.固定样本连续调查的优缺点。
固定样本连续调查具有如下优点:第一,对同一对象长期连续的调查,能掌握变化动态,有利于趋势分析;第二,调查者和被调查者通过长期联系,能较好地合作,调查表回收率高;第三,固定样本的质量及代表性较高,取得的调查资料比较准确。固定样本连续调查的缺点表现在:第一,调查时间长,费用较高;第二,调查时间过长,被调查者会产生厌烦情绪敷衍了事,影响调查资料的准确性;第三,固定样本成员会因迁移等原因而脱节,影响固定样本的代表性。
3.2.3 抽样调查
一、抽样调查的含义
抽样调查是指调查者采用从调查总体中抽选出一部分单位作为样本,对样本进行调查,并用样本所得的结果来推断总体的一种调查方法。该方法的主要优点有三个:一是时间短、收效快;二是费用少;三是质量高,资料可信程度高,特别适用于不可能或没有必要组织全面调查的情形。但它也要缺点,即存在抽样误差。
二、抽样调查的分类
抽样调查分为随机抽样和非随机抽样两类。
1.随机抽样。
随机抽样是按照随机原则抽取样本,即在总体中抽取样本单位时,完全排除了人为主观因素的影响,使每一个单位都有同等的可能性被抽到。遵守随机原则,一方面可使抽取出来的部分单位的分布情况(如不同年龄、文化程度人员的比例等)有较大的可能性接近总体的情况,从而使根据样本所做出的结论对总体研究具有充分的代表性;另一方面,遵循随机原则,有助于调查人员准确地计算抽样误差,并有效地加以控制,从而提高调查的精度。
2.非随机抽样。
非随机抽样不遵循随机原则,它是从方便出发或根据主观的选择来抽取样本。非随机抽样无法估计和控制抽样误差,无法用样本的定量资料,只能采用统计方法来推断总体,但非随机抽样简单易行,尤其适用于做探测性研究。
三、抽样调查的特点
抽样调查的特点有以下几点:
(1)从经济上说,抽样调查节约人力、物力和财力。
(2)抽样调查更节省时间,具有较强的时效性。
(3)抽样调查具有较强的准确性。
(4)通过抽样调查,可使资料收集的深度和广度都大大提高。
尽管抽样调查具有上述优点,但它也存在着某些局限性,它通常只能提供总体的一般资料,而缺少详细的分类资料,在一定程度上难以满足对市场经济活动分析的需要。此外,当抽样数目不足时,将会影响调查结果的准确性。
四、抽样调查的适用范围
1.对一些不可能或不必要进行全面调查的社会经济现象,最宜用抽样方式解决。例如,对有破坏性或损耗性质的商品进行质量检验;对一些具有无限总体的调查(如对森林木材积蓄量的调查)等。
2.在经费、人力、物力和时间有限的情况下,采用抽样调查方法可节省费用,争取时效,用较少的人力、物力和时间达到满意的调查效果。
3.运用抽样调查对全面调查进行验证。全面调查涉及面广、工作量大、花费时间和经费多,组织起来比较困难,但调查质量如何需要检查验证,这时,显然不能用全面调查方式进行。例如,工业全面调查,前后需要几年的时间才能完成,为了节省时间和费用,常用抽样调查进行检查和验证。
4.对某种总体的假设进行验证,判断这种假设的真伪,以决定行为的取舍时,也经常采用抽样调查来测定。
五、抽样调查中常见的概念
(一)全及总体和抽样总体
全及总体简称总体,是指所要调查对象的全体。抽样总体简称样本,是从全及总体中抽选出所要直接观察的全部单位。例如,调查某学校学生的平均月生活费的收入和支出,可以按抽样调查理论从全体学生中抽取部分学生了解,那么全校学生就是全及总体,抽取的部分学生就是抽样总体。
(二)全及指标和抽样指标
1.全及指标。
全及指标是根据全及总体各单位标志值计算的综合指标,常用的全及指标有:全及总体平均数、全及总体成数、全及总体方差和均方差。
全及总体平均数,是全及总体所研究的平均数,根据所掌握资料的情况,可有简单式和加权式的计算方法。
全及总体成数,是指一个现象有两种表现时,其中具有某种标志的单位数在全及总体中所占的比重。例如:产品可分为合格产品和不合格产品,产品总体中合格产品率或不合格产品率就是成数。
2.抽样指标。
抽样指标是根据抽样各单位标志值计算的综合指标。常用的抽样指标有抽样平均数、抽样成数、抽样方差和均方差等。
3.重复抽样和不重复抽样。
重复抽样又称回置抽样,是一种在全及总体中允许多次重复抽取样本单位的抽选方法,即从总体中随机抽出一个样本,再将它放回去,使它仍有被抽到的可能性,而在整个抽样过程中,总体单位数保持不变,被抽中的样本单位的概率也是完全相同的。
不重复抽样又称不回置抽样,即先被抽选的单位不再放回全及总体中,一经抽出,就不会再有第二次被抽中的机会了。在抽样过程中,样本总是逐渐减少。
4.总体分布和样本分布。
总体分布是指全及总体中的各个指标值经过分组所形成的变量数列,而样本分布是指所有可能的样本指标经过分组而形成的变量数列。一般来讲,当总体分布为正态分布时,样本分布也是正态分布;但总体不是正态分布时,样本是否为正态分布主要取决于样本的数量大小,抽样调查的基本要求就是使样本分布尽可能地接近于总体分布。
5.抽样框和抽样单元。
抽样框是指供抽样所用的所有的调查单位的详细名单。例如,要从10000名职工中抽出200名组成一个样本,则10000名职工的名册就是抽样框。
抽样框一般可以采用现成的名单,如户口、企业名录和企事业单位职工的名册等,在没有现成的名单的情况下可由调查人员自己编制。应该注意的是,在利用现有的名单作为抽样框时,要先对该名单进行检查,避免有重复、遗漏的情况发生,以提高样本对总体的代表性。
六、随机抽样调查
(一)随机抽样调查的概念
随机抽样技术又称为概率抽样技术,是根据一个已知的概率来抽取样本单位。也就是说,哪个单位被抽中与否不取决于研究人员的主观意愿,而是取决于客观的机会,即概率。因此哪个单位被抽中与否完全是随机的。
如果总体中每个单位被抽入样本的机会相同,称为等概率抽样;如果总体中每个单位被抽入样本的机会不同,称为不等概率抽样。无论等概率还是不等概率抽样,抽取时都是通过一定的随机化程序来实现。概率抽样不仅要求对目标总体有一个精确的定义,而且要求对抽样框有一个全面的详述。概率抽样的最大特点是抽样成本较高,对抽样设计人员的专业技术要求也较高。
(二)随机抽样调查的优缺点
1.随机抽样调查的优点。
(1)随机抽样是从总体中按照随机原则抽取一部分单位进行的调查。它的调查范围和工作量比较小,又排除了人为的干扰,因此既能省时、省力、省费用,又能较快地取得调查的结果,同时,抽取的样本可以大致的代表总体。
(2)随机抽样技术能够计算调查结果的可靠程度。可通过概率推算其与实际值的差异,即抽样误差(又称代表性误差),将误差控制在一定范围内。
2.随机抽样调查的不足。
(1)对所有调查样本都给予平等看待,难以体现重点。
(2)抽样范围比较广,所需时间长,参加调查的人员和费用多。
(3)需要具有一定专业技术的专业人员进行抽样和资料分析。一般调查人员难以胜任。
(三)随机抽样调查的类型
常用的等概率随机抽样组织形式有简单随机抽样、分层抽样、等距抽样、整群抽样和多阶段抽样。
1.简单随机抽样。
简单随机抽样也称为纯随机抽样,它对总体不作任何处理,不进行分类也不进行排序,而是按照随机原则直接从总体N中抽取n个单位组成样本。纯随机抽样的具体取样方法主要有以下三种:
(1)直接抽取法。
直接抽取法是指从调查对象中直接抽选样本。例如,从仓库存放的某种产品中随机抽取若干件进行质量检查。
(2)抽签法。
抽签法是指先给总体各单位编上序号,然后将号码写在纸片上,将其混合均匀后从中抽选,抽到哪个单位就调查哪个单位,直至抽够预先规定的数量为止。抽签法简单易行,但只适用于总体单位不是很多的情况。
(3)随机数表法。
随机数表又称乱表法,是指含有一系列组别的随机数字的表格。
使用随机数表时,首先要将调查总体中所有的单位加以编号,根据编号的位数确定选用随机数表中若干位数字;然后在随机数表中任意选定一行或一列的数字作为开始数,接着可以按自上而下,或自左而右,或隔一定间隔(隔行或隔列)顺序取数,凡属于编号范围内的数字号码所对应的单位就作为样本单位。如果是不重复抽样,则遇到重复的数字时应舍弃,直到抽够预定的数量为止。
2.分层随机抽样。
分层随机抽样又称为分类随机抽样、类型抽样,是把调查总体按其属性不同分为若干层次(或类型),然后在各层(或类型)中随机抽取样本。例如,调查人口,可按年龄、收入、职业和居住位置等标志划分不同的阶层,然后再按要求在各个阶层中进行随机抽样。
分层随机抽样在市场调查中采用得较多。分层时要注意各层之间有明显的差异,每个单位应该被分配到一层,并且只能分配到一层,不能遗漏任何单位;同一层内的单位应该尽可能同质,不同层的单位应该尽可能异质;分出的层数不宜太多,根据经验,建议不超过六层,否则任何精确度上的收益会被增加的分层和抽样成本所抵消。分层抽样的主要目的是在不增加成本的同时增加精确度。对总体划分各层(类)后,确定各层(类)的抽样单位数。分层随机抽样又分为等比例分层抽样和分层最佳抽样。
(1)等比例分层抽样。(https://www.daowen.com)
等比例分层抽样是按各层(或各类型)中单位数占总体单位数量的比例分配各层样本数量的一种分层抽样技术。
【例3.1】 某地共有居民20000户,按经济收入高低进行分类,其中高收入的居民为4000户,占总体的20%;中收入为12000户,占总体的60%;低收入为4000户,占总体的20%。要从中抽取200户进行家庭购买力调查,按等比例分层抽样技术计算各层应抽取的样本单位数。
解 按等比例分层抽样技术计算各层应抽取的样本单位数分别为
高收入层的样本单位数目=200×20%=40(户);
中收入层的样本单位数目=200×60%=120(户);
低收入层的样本单位数目=200×20%=40(户)。
这种抽样方法简便易行,分配合理,计算简单,适用于各层(或各类型)之间差异不大的分层抽样调查。如果各层(或各类型)之间差异过大,则应采用分层最佳抽样法。
(2)分层最佳抽样。
分层最佳抽样又称为非比例抽样,它不是按各层单位数占总体单位数的比例分配样本,而是根据其他因素(各层平均数或各层标准差的大小、抽取样本工作量大小和费用大小等)调整各层的样本单位数。如按分层标准差大小调整各层样本单位数,其计算公式为:

式中,ni为第i层应抽出的样本数目;n为样本总数目;Ni为第i层的调查单位数;Si第i层调查单位的样本标准差。
【例3.2】 仍以上述居民收入与购买力之间的关系为例。假定各层样本标准差的高收入为300元,中收入为200元,低收入为100元,以分层最佳抽样法确定各层应抽取的样本单位数。
总体单位数N=20000,共需抽取的样本单位数n=200。总体分成三层:N1=4000,N2=12000,N3=4000;各层的标准差分别为:S1=300,S2=200,S3=100。按照公式计算各层应抽取的单位数分别为:60、120、20户。
通过上述计算可以看出,用非比例抽样法与比例抽样法抽取的单位数,各层次之间是不同的,特别是高收入与低收入之间的样本标准差较大,所以高收入层所抽取的样本数增加20户(40户→60户),低收入层减少20户(40户→20户),中收入层不变。由于购买力同家庭经济收入关系很大,因而要增加高收入层的样本数,就要相应地减少低收入层的样本数,这样才能使所抽选的样本更具有代表性。
3.等距抽样。
(1)等距抽样的概念。
等距抽样又称机械抽样,就是先将全及总体各单位按一定标志排列起来,然后按照固定的顺序和一定的间隔来抽取样本单位。
(2)等距抽样的步骤:
①排列所依的标准有两种:一种是按与调查项目无关的标志排队。例如,在住户调查时,选择住户可以按住户所在街区的门牌号码排队,然后每隔若干个号码抽选一户进行调查;另一种是按与调查项目有关的标志排队。例如,住户调查时,可按住户平均月收入排队,再进行抽选。
②在排队的基础上,还要计算抽选距离(间隔),抽选距离=N/n。
③确定抽选距离之后,可以采用简单随机抽样方式,从第一段距离中抽取第一个单位;为简化工作并防止出现某种系统性偏差,也可以从距离的1/2处抽取第一个单位,并按抽选距离继续抽选剩余单位,直到抽完为止。
【例3.3】 从600名大学生中抽选50名大学生进行调查。
解 可以利用学校现有的名册顺序按编号排队,从1号编至600号,则有
抽选距离=N/n=600/50=12(人)
用简单随机抽样方式,抽取第一个样本单位,如果抽到的是8号,那么依次抽出的是20号、32号、44号……
(3)等距抽样的优缺点。
①优点:等距抽样与简单随机抽样比较,可使中选单位比较均匀地分布在全及总体中,尤其当被研究对象的标志值的变异程度较大,而在实际工作中又不可能抽选更多的样本单位时,这种方法更为有效。因此,等距抽样是市场调查中应用最广的一种抽样方式。
②缺点:等距抽样也有一定的局限性,具体表现在以下两个方面:
第一,运用等距抽样的前提是要有全及总体中每个单位的有关资料,特别是按有关标志排队时,往往要有较为详细具体的资料,这是一项既复杂又细致的工作。
第二,当抽样间隔和被调查对象本身的节奏性相重合时,就会影响调查的精度。如对某商场每周的商品销售量情况进行抽样调查,若抽取的第一个样本是周末,抽样间隔为7天,那么抽取的样本单位都是周末。而往往周末商品销售量最大,这样就会发生系统性偏差,从而影响等距抽样的代表性。
4.整群抽样。
在实际工作中,为了便于调查,节省人力和时间,往往是一批一批(一群一群)地抽取样本,每抽一批(一群)时,就把其中所有单位全部加以登记,以此来推断总体的一般情况,这种抽样方式称为整群抽样。例如,对工业产品进行质量调查时,每隔5个小时,抽取1个小时的产品进行检查。
划分群时,每群的单位数可以相等,也可以不等;在每一群中的具体抽选方式,既可以采用随机的方式,也可以采用等距抽样的方式,但不管采用什么方式,都只能使用不重复的抽样方法。
整群抽样的优点是组织工作比较方便,确定一组就可以抽出许多单位进行观察。但是,正是因为以群体为单位进行抽选,抽选单位比较集中,明显地影响了样本分布的均衡性。因此,整群抽样与其他产业相比,在抽样单位数目相同的条件下抽样误差较大,代表性较低。在抽样调查实践中,采用整群抽样一般都需要比其他抽样抽选更多的单位,以降低抽样误差,提高抽样结果的准确度。
当然,整群抽样的可靠度主要还是取决于群与群之间差异的大小,当各群间差异较小时,整群抽样的调查结果就比较准确。因此,在大规模的市场调查中,当群体内各单位间的误差较大,而各群之间的差异较小时,最适宜采用整群抽样方式。
5.多阶段抽样。
当总体的容量很大,特别是总体的分布范围很广时,无论采用上述哪种抽样方法,都很难一次性直接抽到最终的样本。在这种情况下,研究者一般采用多阶段抽样的方法。
多阶段抽样的方法是把抽取样本单位的过程分为若干个阶段进行,即先从总体中抽取若干一级单位,再从抽中的一级单位中抽取若干二级单位,接着从抽中的二级单位里抽取三级单位。以此类推,直到最后抽取样本基本单位。样本基本单位是该项调查的最小单位,是调查项目的基本承担者。我国的农业产量抽样调查,一般采用五级抽样:第一步从全部的省中抽县(全国的所有县都有被抽中的可能),第二步从抽中的县中抽乡,第三步从抽中的乡中抽村,第四步从抽中的村中抽地块,最后一步从抽中的地块中抽小面积实测单位。也就是说,在不同的抽样阶段中,抽样单位和抽样框都是不同的,下面举例说明多阶段抽样方法。
【例3.4】 假设要调查某市中学生的消费情况,总体为该市全体中学生,样本规模为400人。
我们可以把抽样过程分为下述几个阶段进行:
首先,在城区这一层次上进行抽样。假设该市有七个城区,我们可采用简单随机抽样的方法从中抽取两个城区。
其次,在学校这一层次上进行抽样。即从所抽中的两个城区内的几十所中学中,采用简单随机抽样(或等距抽样)的方法各抽取5所中学,这样共抽取10所中学。
再次,在班级这一层次上进行抽样。即从所抽中的学校中,以班级为单位进行抽样。假定每所学校有15个班,我们从中抽取4个班,这样10所学校共抽取40个班。
最后,在学生这一层次上抽样。此时的抽样对象是学生,即从每个抽中的班中随机抽取10名学生。也就是说,这40个班中共抽到学生400人,将他们合起来即构成调查的样本。
在上述四个阶段中,每一次的抽样单位和抽样框都不相同,它们分别是:①城区和该市七个城区的名单;②中学和所抽城区全部中学的名单;③班级和所抽学校全部班级的名单;④学生和所抽班级全部学生的名单。而整个抽样过程也可看成是两个基本步骤的反复运用,即建立抽样框和抽取样本。
【小资料】
多阶段抽样与整群抽样、分层抽样的区别
整群抽样虽然类似于多阶段抽样,但这两者之间是有区别的(区别在第二阶段)。以两阶段抽样为例,整群抽样是从总体中随机地抽取部分群体,然后,对抽中的群体进行全面调查;而两阶段抽样是第一阶段抽取部分群体,然后,在第二阶段对抽中的群体进行抽样调查。两阶段抽样和分层抽样虽然都需要对总体进行分组,但两者之间也有区别(区别在第一阶段):分层抽样首先抽取了全部的群体,然后在各群体中抽取部分单位进行调查;而两阶段抽样则是在第一阶段随机的抽取部分群体,然后再从中选的群体中抽取部分单位作为第二阶段的样本进行调查。所以,两阶段抽样在组织技术上可视作整群抽样和分层抽样的结合。
【小资料】
抽样误差的确定
1.抽样平均误差的确定。
(1)抽样误差是指随机抽样调查中发生的代表性误差,即平均差,通常用符号U表示。因为抽样调查是以样本代表总体,以样本综合指标推断总体综合指标,所以平均误差是不可避免的。但这种误差一般不包括技术性误差,即调查过程中的工作误差。
(2)影响抽样误差大小的因素有:①总体单位之间的标志变异程度。总体单位之间标志变异程度大,抽样误差大,反之则小,所以抽样误差大小同总体标准差大小成正比例关系。②样本单位的数目多少与抽样误差大小有关。样本单位数目越多,抽样误差越小;样本单位数目越少,抽样误差越大,所以抽样误差的大小同样本单位数成反比例的关系。③抽样方法的不同,抽样误差大小也不相同。一般来说,简单随机抽样比分层、分群抽样误差大,重复抽样比不重复抽样误差大。
(3)重复抽样是指样本抽出后再放回去,有可能被第二次抽中;而不重复抽样是样本抽出后不再放回,每个单位只能抽中一次。实践中大多数采用不重复抽样。
①平均数重复抽样误差的计算公式为

②平均数不重复抽样误差的计算公式为

式中,
表示平均数的抽样平均误差;
表示全及总体平均数标准差;n表示样本容量;N表示全及总体数目。
2.抽样极限误差。
抽样平均误差可以用来测定抽样指标对总体指标的可能离差。根据概率原理,给定一定的概率可以保证抽样误差不超过某一给定范围,这个给定的范围就叫做极限抽样误差。
中心极限定理已证明,概率度t和概率p成函数关系,即
![]()
即t每取一个值,都有唯一确定的p值与之相对应。在实际工作中,为了使用的方便,将不同的t值与其相应的概率p预先算好,编成概率表,供调查时使用。几个常用的概率度和概率之间的关系如表3.1所示。
表3.1 概率度和概率函数关系表

七、非随机抽样类型
(一)非随机抽样的概念
非随机抽样又称非概率抽样,是研究人员有意识的选择样本单位,且样本单位的抽取不是随机的。
随机抽样的主要优点是可以从样本去推论总体。然而,在有些情况下,严格的随机抽样往往难以进行;而在另一些情况下,研究者的主要目的只是想初步了解一下调查对象的有关情况,以便为建立研究假设或进行大规模的正式调查做些探索性工作。此时,人们往往会放弃虽然科学、但却比较麻烦的各种随机抽样方法,而采用虽不能推论总体,但简单方便的非随机抽样方法。
(二)非随机抽样的优缺点
1.非随机抽样的优点:
(1)非随机抽样技术按一定的主观标准抽选样本,可以充分利用已知资料,选择较为典型的样本,使样本更好地代表总体。
(2)可以缩小抽样范围,节约调查时间、调查人员和调查费用。
2.非随机抽样技术的缺点:
使用非随机抽样技术进行调查,主要的不足是无法判断其误差和检查结果的准确性。这是因为,用非随机抽样技术进行调查的总体中,每一个样本被抽取的概率不一样,概率值的大小不清楚,无法借助概率来计算推算值与实际值的差异并得出其误差。可靠程度只能由调查人员主观评定。由于主观标准不当或主观判断失误均会增加抽样误差,出现差错难以核实。
(三)非随机抽样的类型
1.任意抽样。
任意抽样又称为便利抽样,是根据调查者的方便与否来抽取样本的一种抽样方法。“街头拦人法”和“空间抽样法”是任意抽样的两种最常见的方法。
(1)“街头拦人法”。
“街头拦人法”是指在街上或路口任意找某个行人,将其作为被调查者,进行调查。例如,在街头向行人询问其对某一社会热点问题的看法,请行人填写某种问卷等。
(2)“空间抽样法”。
“空间抽样法”是指对某一聚集的人群,从空间的不同方向和方位对他们进行抽样调查。例如,在商场内向某一群顾客询问其对商场服务质量的意见;在教室里向前两排的学生询问其学习情况等。
任意抽样简便易行,能及时取得所需的信息资料,省时、省力、节约经费,但抽样偏差较大,一般用于非正式的探测调查,只有在调查总体各单位之间的差异不大时,抽取的样本才具有较高的代表性。
2.判断抽样。
判断抽样又称为目的抽样,是指抽取样本时,由调查人员依据对实际情况的了解、经验、主观分析和判断,人为确定样本单位,或由某些有见解的专家选定样本的抽样方法。这种抽样方法所得的样本对总体的代表性,完全取决于研究者对总体的了解程度以及分析和判断能力。
判断抽样时,根据调查目的的不同,样本单位的确定通常有几种情况:第一种是选择“平均型”样本,即在调查总体中选择能代表平均水平的样本,其目的是了解总体平均水平的大体位置;第二种是选择“众数型”样本,即在调查总体中选择能够反映大多数单位情况的个体为样本;第三种是选择“特殊型”样本,比如选择很好(高)的或很差(低)的典型单位为样本,目的是分析研究造成这种异常的原因。
判断抽样简便快捷、节省费用,符合调查目的和特殊需要。但由于样本选择是主观的,所以样本的质量取决于调查人员的经验、专业知识和对情况的了解,而且不支持对一个特定总体的直接推论。
3.配额抽样。
配额抽样是非随机抽样中最流行的一种,它是指首先将总体中的所有单位按一定的标志分为若干类(组),然后在每一类(组)中用便利抽样或判断抽样的方法选取样本单位。与分层抽样不同的是,配额抽样不遵循随机原则,而是主观地确定对象分配比例。
配额抽样按照分配样本数目时控制特征是否相互牵制,可分为独立控制配额抽样和相互控制配额抽样两大类。
(1)独立控制配额抽样。
独立控制配额抽样是指对调查对象只规定具有一种控制特征的样本抽取数目,并规定配额的抽样方法。具体应用如下:在一个城市中欲采用配额抽样抽取一个n=180的样本。调查对象的控制有年龄、性别和收入,配额是按照单个特征分配的,如表3.2、表3.3、表3.4所示。
表3.2 按年龄控制特征配额分配表 单位:人

表3.3 按性别控制特征配额分配表 单位:人

表3.4 按收入控制特征配额分配表 单位:人

从上面三个表中可以看出,虽然有年龄、性别和收入三个控制特征,但每个特征是独立控制配额抽取样本数目的,不要求相互受到牵制,也不规定三个控制特征之间有任何关系。如在年龄组20~30岁中有30人,这30人中没有规定男、女各多少人,高收入、中收入及低收入又有多少,这就是独立控制配额抽样的特点。
独立控制配额具有简单易行、费用少等优点,但是选择样本容易偏向某一类型而忽视其他类型的缺点。不过,这个缺点可通过相互控制配额抽样来弥补。
(2)相互控制配额抽样。
相互控制配额抽样是对调查对象规定两种或两种以上控制特征的样本抽取数目,并规定配额的抽样方法。具体操作方法是借助于相互控制配额抽样表来完成抽样分配。例如,前例180人的样本要具有三种控制特征:年龄、性别和收入,如表3.5所示。根据相互控制配额抽样表,市场调查人员可以清楚地知道自己应该抽取若干个控制特征的样本数。例如,20~30岁的被调查者应有30人,其中高收入的男性和女性各抽3人,中收入的男、女各抽4人,低收入的男、女各抽8人。
表3.5 相互控制配额抽样表 单位:人

控制配额抽样方法的工作步骤有以下几个:
第一步:确定控制特征。调查人员可事先根据调查的目的和客观情况,确定调查对象的控制特征,作为总体分类的划分标准。如年龄、性别、收入和文化程度等。
第二步:根据控制特征对总体分层,计算各层占调查总体的比例,确定各层之间的比例关系。例如,以家庭人口和月收入为控制特征,制定相互控制配额比例表。
第三步:确定每层的样本数。首先确定样本总数,然后根据每层占总体的比例确定每层应抽取的数目。
第四步:配额分配,确定调查单位。在各层抽取样本数确定之后,调查人员就可以在指定的样本配额限度内任意选择样本单位。
配额抽样方法简单易行,可以保证总体的各个类别都能包括在所抽样之中,因此配额抽样的样本具有较高的代表性。但也应注意到这种方法具有一定的假设性,即假定具有某种相同特征的调查对象,其行为、态度与反应都基本一致,因此,对同一层内的调查对象,是否采取随机抽样就无关紧要了。由于抽样误差不大,只要问卷设计合理、分析方法正确,所得的结果同样值得信赖。这种假设性是否得以成立,在很大程度上取决于调查者的知识、水平和经验。
【小资料】
配额抽样与分层抽样、判断抽样的异同
1.配额抽样与分层抽样的异同。运用配额抽样进行抽样,要按照一定的标准,分配样本数额,并在规定数额内由调查人员任意抽选样本。这种方法与分层抽样有相似的地方,都是事先对总体中所有单位按其属性、特征(这些属性、特征我们称之为“控制特征”)分类、分层,但两者有本质区别,两者的抽样目的和方法均不同。配额抽样之所以分层分类,其目的在于要抽选出一个总体的“模拟物”,其方法是通过主观的分析判断来确定和选择组成这种模拟物的成员。分层抽样进行分层时,一方面是要提高各层间的异质性和同层中的同质性,另一方面也为了照顾某些比例较小的层次,使得所抽样本的代表性进一步提高,误差进一步缩小。而其抽样方法则完全是依据随机原则,排除主观因素,客观的、等概率的从各层中进行抽样,这与配额抽样中那种“按事先规定的条件,有目的地去寻找”的做法完全不同。
2.配额抽样与判断抽样的异同。配额抽样是在规定数额内由调研人员任意抽选样本,这与判断抽样有调研人员人为确定样本是有区别的:首先,抽取样本的方式不同。配额抽样是分别从总体的各个控制特征的层次中抽取若干个样本单位组成样本,而判断抽样是从总体的某一层次中抽取若干个符合条件的典型样本。其次,抽样要求不同。配额抽样注重“量”的分配,而判断抽样注重“质”的分配。最后,抽样方法不同。配额抽样方法复杂精密,判断抽样方法简单易行。
4.滚雪球抽样。
滚雪球抽样是一种特殊的抽样方法。它先从几个合适的个体开始,然后通过他们得到更多的个体。
在市场调查中,当我们遇到无法了解总体状况的情形时,可以采用这种方法,即先从那个总体中少数合适的成员入手,访谈后向他们询问还知道哪些符合条件的成员。然后再去找那些成员调查,并同时要求他们推荐后面的被访者。像这样的过程可以一轮接一轮地进行下去,就像滚雪球似的,从小到大,所调查的成员越来越多。即使在选择最初的被访者时使用了随机抽样,最终的样本还是一个非随机抽样样本。与随机的方式相比,被推荐的人将具有与推荐的人更为相似的心理特征。
滚雪球抽样的一个主要目的是估计在总体中非常稀少的某些特征,它的主要优点是显著地增加了总体中找到具有某种特征的个体的可能性,同时误差和成本相对较低。
【例3.5】 全国电视机市场调查抽样设计。
抽样设计是项目调查、管理和实施的关键,是调查项目成功与否的关键,此次调查采用分层、多阶段、不等概率、系统随机抽样,样本容量为10800个居民户。样本设计的具体思路如下:
(1)分层。
先将全国各省、自治区、直辖市按其地理位置和经济发展程度分成沿海、内地和边远三类,以地区及省、自治区、直辖市为层,各层分别独立抽样。由于每层的总户数是确知的,因此各层权重可知。这在由样本观察推算总体目标时是必需的。采取这样的分层技术,一是为了获得更高的精度,二是为了组织调查和汇总数据方便,三是能够同时得到分地区以及分省、自治区、直辖市的结果。
(2)多阶段。
在各层分别独立抽样时,每层的基本单位数仍然很庞大,且分布面很广,很难用单阶段抽样产生一个完整的样本。一般采用四阶段抽样方法:首先在每层内先抽市(区)或县;在每个抽样中的市、县中抽街道或乡;在每个抽样中的街道或乡中抽居民(或村民)委员会;最后抽调查户。其中每一阶段抽样又根据条件规定了具体的抽样细则。这样,在实践过程中,每阶段只需局部的有关市(县)或街道(乡)等的抽样框,同时又能使所得样本相对集中,便于实际调查。
(3)不等概率抽样。
在第二和第三阶段上采用不等概率抽样,这是基于这样的街道(乡)、居民(村民)委员会等抽样单元规模大小不一,为使每个住户都有大致相等的被抽中机会,在市(县)抽街道(乡)时,按与各街道(乡)所含户数基本成比例的不等概率抽取街道(乡)。这样,户数多的街道(乡)被抽中的概率就大。
(4)系统随机抽样。
在第四阶段上采用系统随机抽样。这一方法的突出优点,首先是便于实施,节省时间,不易出差错。其次,样本在总体中分布的更均匀。
总之,上述严格的抽样方法尽可能地排除了各种人为的干扰,保证获得的样本具有足够的代表性,从而尽可能地提高抽样概率。