8.1.4 问卷设计技术

8.1.4 问卷设计技术

问卷设计技术主要包括题型和答案、问题次序和数量、问题语言和提问方式、编码和栏码的设计等。

8.1.4.1 题型和答案

调查研究中使用的问卷一般是以封闭式问题为主,根据问题的形式,问卷中的题型主要有填空题、选择题、排序题和关联题,其中选择题又可分为单项选择题、多项选择题、任意选择题、表列式选择题。

填空题在问卷中大多数用于收集数值性资料,例如年龄、收入、支出、时间安排或者比较简单的问题。选择“其他”答案的,需要用文字具体说明。表8-6问卷中的A1, A4, A5, A9, A10, A13, A18, A54~A57都是填空题。

单项选择题就是在规定的答案范围内只允许选择一项答案,这类题型在问卷中是最多的。表8-6中A2, A3, A7, A8等都是单项选择题。多项选择题是在规定的答案范围内允许选择两个以上的答案。一般而言,多项选择题的备选答案较多,如果答案只有四五个,允许选择多项答案的余地就比较小。同时,允许选择的答案不宜太多,一般不要超过三个。表8-6中A22,A25是多项选择题。单项选择题与多项选择题各有利弊。单项选择题可以使问题的回答更集中,有时可以“迫使”被调查者在犹豫之中做出自己的判断,并且资料的统计处理也很方便。但是,由于社会现象是受到很多因素影响的,只允许选择一项答案有时会让被调查者为难。例如,调查人们的闲暇活动时,作为单项选择题你可以问“你最喜欢的闲暇活动是什么?”但是,实际生活中一个人喜欢的闲暇活动可能不止一项,单项选择题虽然也可以“迫使”他只能选择“最喜欢”的一项活动,但是对于被调查者来说毕竟不太“友好”,因此多项选择题可以弥补这方面的不足,让被调查者有更多的选择。当然,多项选择题会给资料的统计分析带来一些困难。在问卷设计中,只要不给被调查者的回答带来困难,应该尽量采用单项选择题。任意选择题是在规定的答案中由被调查者按照自己的情况选择他认为符合自己情况或判断的答案。多项选择题要规定允许选择的答案数量,而任意选择题就不再这样规定。实际上,任意选择题和表列式选择题都是把相同答案的若干个问题归并在一个问题之中。例如表8-6中A6、 A44就是任意选择题,在A6中实际上就是把“爸爸和你住在一起吗?”“妈妈和你住在一起吗?”“爷爷或奶奶和你住在一起吗?”等9个问题合在一起;A44也是如此,即把“在你要好的小朋友或同学中有没有经常打架的行为?”“在你要好的小朋友或同学中有没有喜欢讲脏话的行为?”等15个问题合在一起。表列式选择题通常是量表类型的问题,是把测量目标相同、答案相同的问题合在一起。例如常用的态度量表就是表列式选择题。表列式选择题也可以是由几个问题组合在一起的,以下就是由三个问题组合在一起的表列式选择题(见表8-7):

表8-7 表列式选择题举例

排序题是由被调查者根据一定的标准,如重要性、时间性或者难易程度对所选择的答案进行排序。排序题分为多项排序和全部排序。多项排序是在多项选择题的基础上发展出来的,不仅可以确定被调查者所选答案的重要性程度,也可以按照加权方法,将多项选择的答案合并成单项选择。例如,表8-6中A25题原来是多项选择题,如果作为多项排序题可以改为如下形式(见表8-8):

表8-8 多项排序题举例

多项排序题可以按照加权方法,把多项选择的同一个答案的比率合在一起,成为单项选择的比率。例如,选择答案“学习”的,认为“最多”的占25%、“一般”的占12%、“较短”的占8%,如果“最多”“一般”“较短”的权数分别为3, 2, 1,分别乘以各自的比率,加总除以6即为选择“学习”的单项比率。根据计算,最后选择“学习”的加权比率为:如果选择“我的零用钱”的“最多”“一般”“较短”的比率分比为20%、 30%、 10%,加权比率为:

全部排序就是要求被调查者根据一定的标准对答案全部排序,经过计算可以获得不同答案在等级上的高低。例如,上例也可以改为全部排序题(见表8-9) :

表8-9 全部排序题举例A

全部排序题在社会分层或职业声望调查中运用比较多,研究者可以采用这样的题型获得有关职业声望的资料,即用打分的方式表示职业等级上的高低,也可以反映不同社会阶层或群体对社会分配的主观评价。例如,想获得干部、知识分子、工人、农民、私营企业主、个体工商户等群体分享改革开放成果大小的主观评价,可以设计如下问题(见表8-10) :

表8-10 全部排序题举例B

关联题是指前后两个问题的回答是相互联系的,前面一个问题的回答会影响到后面一个问题的回答。通常前面一个问题称为“过滤性问题”,后面一个问题称为“相倚性问题”。例如,表8-6中A7; A8和A9; A17和A18,A19; A20和A21; A36; A41和A42; A45就是关联性问题,其中A7题中“和你住在一起的哥哥或姐姐、叔叔或姑姑、舅舅或阿姨有没有结过婚的?”是过滤性问题,“如果有的话,他们是谁?”是相倚性问题,只有对前一个问题作出肯定回答,才需要回答下面一个问题。同理,A8是过滤性问题,A9是相倚性问题。关联性问题还可以采用如下形式(见表8-11) :

表8-11 关联性问题形式举例

在设计封闭式问题答案时,除了要符合互斥性和穷尽性的要求外,有时还要注意答案类别所表示的意义。一般而言,问卷上的问题答案是比较具体的,在资料分析时还要经过重新分类上升到更为抽象的概念层面。例如,在调查人们的闲暇活动时,各种各样的活动可能有二十多种,但是在进行统计分析时,除了要进行具体的描述,还要进行分类整理,简化成几个类别,如“学习型”“休闲型”“娱乐型”“健身型”“交际型”等,以便进行中高级统计分析。又如,在调查人们的择偶自主性时,答案可能有“自己认识、网上认识、朋友介绍、征婚广告、媒体活动、婚介所、亲属介绍、父母介绍、媒人介绍、其他”,在分析资料时可以根据择偶的自主性程度分为高、中上、中、中低、低五种类型,其中“自己认识、网上认识”自主性程度最高,“中上”是“征婚广告、媒体活动、婚介所”,“中等”是“朋友介绍”,“中低”是“亲属介绍”,“最低”是“父母介绍、媒人介绍”。

8.1.4.2 问题次序和数量

问卷中的问题实际上是对某种现象的测量指标,具有内在的逻辑性,同时问题的先后次序要与人们思考问题的习惯相一致,并有利于访谈气氛的营造。大致说来,问题次序可以根据问题的内容、时间和类别进行安排。

先易后难,即先问简单的问题,后问比较复杂的问题。表8-6中先问家庭的居住情况和个人的信息,然后再问个人的学习和兴趣爱好、个人的不良行为等方面的问题。先一般后特殊,即对一个具体的问题的了解,可以先问一般性的问题,然后逐步深入,问一些比较特殊或敏感的问题。表8-6中有关个人与父母之间的交往,先问个人与父母之间的沟通情况,再问沟通的内容和时间的长短。先客观后主观,即先问客观性问题,后问主观性问题,因为客观性问题一般都是事实类问题,比较容易回答;主观性问题有的需要思考,有的比较敏感,不太容易回答,放在后面比较好,如对父母关系的评价等。不少问卷还有一些比较复杂的量表,也应该放在后面。如果调查内容涉及“过程性”问题,应该根据时间的先后提问。例如,想了解个人的工作经历,就要根据工作经历时间先后提问,先问第一次工作的时间,什么时候换了工作等,不要跳跃性提问,跳跃性提问容易干扰被调查者的记忆。当然,也可以先问记得比较清楚的、发生在最近的事情,再问前面发生的事情。总的来说,根据时间次序,可以由远到近,也可以由近到远,但不要把时间顺序搞乱了。另外,尽可能把同一类问题放在一起。一份问卷中的问题比较多时,会涉及几个大问题,要尽可能把同一类问题放在一起。表8-6中的大类问题有:个人和家庭的基本情况;学习情况;兴趣爱好;个人与同学、朋友、父母之间的关系;不良行为等。要尽可能把同类问题放在一起,这样可以使提问具有连贯性,被调查者回答问题比较集中,符合思考问题的习惯,也便于发现所获资料可能存在的问题。还有,把能引起被调查者兴趣的问题尽可能放在前面。把简单、一般的问题放在前面,并不意味越简单越好,作为开始的问项还应该富有吸引力,使被调查者产生兴趣,更快地进入访谈的氛围。例如,考虑到很多孩子都比较喜欢玩电子游戏,表8-6也可以把玩电子游戏的问题放在较前面的地方,使被调查者对调查感兴趣,引发他们接受调查的愿望,也不会使问卷调查过于枯燥。关于个人背景或特征类的资料一般放在后面,如性别、年龄、职业、教育程度等,放在问卷的前面一方面像在调查户口,另一方面这些问题有的涉及个人隐私,放在前面容易使被调查者为难。但是放在后面有时会产生漏填或漏答的情况,尤其是自填式问卷。因此,调查员在访问结束或者在收回问卷时一定要认真检查,因为个人特征类资料的缺失,会对统计分析带来较大影响。一个比较可行的办法是,对那些比较敏感的个人特征资料如收入等可以放在后面问,其他个人特征的资料可以和相关问题放在一起,或放在稍前的位置。

问题的数量即问卷的长度,虽然很难有一个具体的标准,但是按一些调查研究专家的经验,一份问卷的长度即其包含的问题,一般以被调查者能在半个小时内完成为宜。问卷的长度受到两个条件的制约:资料的准确性和被调查者愿意接受调查的时间。研究者总是希望在一次调查中获得最多的信息,问题较多,问卷较长,但是这样的结果经常会使被调查者在填写问卷或接受调查时产生厌烦情绪,就会对最后的,却往往是比较重要的问题敷衍了事,影响资料的准确性。因此,首先要考虑问卷的长度能否被调查者接受,能否获得准确的资料。在特殊情况下,对于比较长的问卷,调查员一定要向被调查者做好解释工作,以使他们愿意接受调查或填写问卷。

8.1.4.3 问题用语或提问技巧

在测量指标确定的条件下,问卷设计在某种意义上就是把指标转换成提问,即用什么样的语言表述指标的意义。问题设计除了题型和答案、次序和数量方面要注意若干原则,还需要重视问题的用语技巧。

首先,对于一些容易引起被调查者反感或者误会的指标,需要转换为比较适当的问题或提问。例如,在对妇女婚姻问题调查时,经常会测量她们的初婚年龄,直截了当地问“您第一次结婚时年龄是多少?”就显得比较唐突(因为这样的提问暗含着还有第二次婚姻)。毕竟在我国离婚还不是普遍的现象。因此,在设计问题时可以先问“您是在哪一年成家的?”或者“您成家有多少年了?”(婚龄),然后利用计算软件把成家年份减去出生年份,或者把现在年龄减去婚龄就是初婚年龄。

其次,对于不同的调查对象,问题的用语是不同的,如老年人和青年人的教育程度是不一样的,城市居民和农村居民的认知水平也有差异,因此针对不同的调查对象,要采用不同的提问或用语。例如,“闲暇生活”这一用语对于青年人是容易理解的,但是对于老年人或农村居民就有可能不太理解,要调查老年人或农村居民的闲暇生活就要转换为更通俗的语言,可以问“您的空余时间是怎样安排的?”或者“您在空余时间有什么活动或做什么事情?”

第三,有些指标虽然是比较具体的,但是对于非专业人员来说还是不能正确理解。因此在设计问题时,只能先问一些被调查者容易理解和回答的问题,然后由调查员根据回答进行归类。例如,职业是大多数问卷调查中必须要收集的资料,在调查中应该先由被调查者回答自己的具体工作,然后由调查员根据职业分类标准,归到不同的职业类别之中,相类似的问题还有家庭结构等。

第四,涉及个人自我评价的指标,最好先问被调查者对其他人的评价,再问自我评价。例如一项有关居民行为规范的调查,指标设计非常具体、详细,其中包括“文明出行”“保护环境”等指标及其具体表现,由于调查时只问本人“是否知晓”“是否做到”,结果95%以上的人都认为已经做到了,但是实际情况并不如此。如果在设计问卷时先问对其他居民行为规范的评价,情况就会大不相同。因为在大多数情况下,人们的自我评价会高于对他人的评价。

第五,问题的语言要尽量简短、清楚、准确。也许受到英语用语习惯的影响,现在不少问卷的问题语言过于冗长,不能清楚地表达问题的意义。例如,在社会流动调查中,问及个人的职业发展空间时,如果问题是这样表述的:“您认为您现在从事的工作今后还有没有升职的可能性?”还不如改为:“最近三年中您会升职吗?”还有,如果在答案上没有具体的说明,一个问题的表述不要含有几个问题,即一题多问;问题的答案不应该出现“正确”或“错误”的选择以及答非所问。例如,“您和家人的教育程度是什么?”就是一题多问,如果不能在答案上具体说明家庭成员是谁,被调查者就不可能回答;“学生考试作弊一律退学,您认为对吗?”应该改为“您是否同意学生考试作弊一律退学?”因为问卷调查不是测验,“是”与“非”的价值判断会给被调查者带来一定的压力;如果问题是:“最近您是否与配偶争吵过?”但是答案却是“经常、偶尔、没有”就是答非所问,答案应该改为“是、否”,或者把“最近您是否与配偶争吵过?”作为过滤性问题,对于肯定回答者,再问“您经常与配偶争吵吗?”答案为“是、否”或者“经常、偶尔、说不清”。

8.1.4.4 编码和栏码

所谓编码是将资料系统化、类别化的过程。它要求将资料按一定的标准加以分类,然后以符号(数字或字母)来表示各种类别,因此编码的作用在于简化各种资料,即以符号代替文字资料,从而为资料的统计分析创造条件。需要指出的是,虽然用来编码的符号可以是数字或字母,但是一般使用阿拉伯数字作为编码的符号,一是因为计算机输入资料时,只用右边的数字键盘输入,既方便又快捷。二是在计算过程中,研究者常常还要根据需要进行再编码,用阿拉伯数字作为编码符号在其转换或再编码时比较方便。因此,所谓编码更为简单的定义是:用阿拉伯数字代替问卷中的文字资料,即将问卷中的文字答案转换成数字的过程。

编码的形式主要有两种,即预编码(事前编码)和后编码(事后编码)。预编码就是在设计问卷的同时,就安排好每一个问题答案的编码。以封闭式问题为主的问卷主要采用预编码的形式。预编码是比较简单的,例如,关于性别的编码,其答案类别只有“男”“女”两个,只要以数字“1”表示男性,“2”表示女性即可。后编码主要是在调查结束以后整理资料时进行编码,开放式问题采用的是后编码的形式。由于开放式问题答案不可能在调查前就预先拟定,被调查者对于同一问题的答案可能是多种多样的,因此只有在调查结束以后,在对资料分析的基础上归纳、概括、分类,然后再进行编码。由于调查研究通常是规模较大的抽样调查,因此预编码是最主要的形式,即问卷设计同时也包括了编码设计,后编码越少越好。编码方法主要是:

(1)确定答案代码。根据答案的不同类型,答案代码的确定有所不同。单项选择题和多项选择题是按照答案的数量直接用数字表示每个答案的代号,答案的数量在9个以内,分别用1, 2, 3, …代表每个答案;答案数量超过10个以上,分别用1, 2, 3, …, 10, 11, 12,…代表每个答案(参见表8-6中A3, A22题)。

矩阵式问题或表列式问题实际上是把具有相同答案的问题归并在一张表上,也可以采用预编码方法(参见表8-7) 。

答案特别多的任意选择题,例如表8-6中A44题,供选择的答案有15个,为了使编码更为简便,减少数据文件的长度,答案可以设计为:“有”与“无”或者“是”与“否”,分别用“1”表示“有(是)”,用“2”或者“0”表示“无(否)”,其他如家庭耐用消费品情况,一般也是采用这样的编码方法。这样的任意选择题相当于矩阵式问题或表格式问题,也是把具有相同答案的问题归在一起。

以封闭式问题为主的问卷中的填空题,通常是一些数值型问题,例如收入、年龄、家庭人口数等,可以直接把数字填在空白处,这些数字严格的说不是编码,而是属于定比测量的调查资料,是具有数学特征的编码。

编码中的某些代号具有特殊的意义。一般而言, “0”通常作为缺省值,或无回答、不适用、没有等。 “9”通常作为特殊值,如不知道、不详或其他。当然,编码数值在9个以上(两位数)时,“9”可能是有实际意义的,此时用来表示特殊值的应该是“99” ,例如年龄(抽样调查中一般不可能抽到年龄为99岁的老人);如果是月收入,通常用“9999”表示不详,如果月收入在1万元以上,编码的数字范围只有四位数,可以用“9998”表示。需要强调的是“0”和“9”的运用还是要根据具体情况加以规定,以上举例只是通例。

(2)栏码分配。所谓栏码或编码序号是指问卷中的每个问题或变量在数据文件中的位置。如果我们把问卷中的每个问题比作一个个家庭,那么栏码相当于“家庭地址”。栏码一般放在问卷的最右边,是用来填写答案编码的地方。

栏码是从问卷的第一个项目(通常是个案编号)或问题开始,根据每个项目或问题的编码位数和允许选择的答案数量分配栏码位数。一个项目或问题的栏码位数主要取决于两个因素:问题答案的位数和允许选择的次数。一个问题如果只允许选择一个答案,栏码的位数根据答案的位数决定,即答案为个位数,只给一个位置,栏码位数为1;答案为两位数,要给两个位置,栏码位数为2;如果允许一个问题可以选择两个以上的答案,栏码位数的多少就是答案位数乘以允许选择的次数。例如,一个问题允许选择两个答案,如果答案位数是个位数,那么栏码位数为2,给两个位置(见表8-12中A42题);同理,如果可选3个答案,且答案位数是两位数,那么栏码位数为6,给六个位置(见表8-12中A22题)。对于任意选择题或量表来说,每个项目或指标都要分配一个位置(见表8-12中A44题);属于定比测量的变量或问题,则要根据具体的变量安排相应的位置,例如年龄一般给两个位置(见表8-12中A10题),住房面积给三个位置,月收入如果按照实际收入数,要给四个位置。按照以上方法,表8-6的栏码位数可作如下分配(见表8-12) :

问卷编号则根据具体情况规定。例如,某城市调查采用PPS抽样方法,被抽取的街道有20个,样本为1000人,每个街道被调查的初中学生50人,因此街道编号给两个位置,个人编号也给两个位置即可。表8-13是根据表8-12部分调查的数据文件制成的,从中可以形象地看出栏码的意义是什么。

(3)编制编码手册。编码手册即编码簿,是用来说明数据文件中每个项目或问题及其答案(变量)的符号所代表的意义以及编码细则,是编码员对问卷进行编码的依据。编码手册主要包括项目或问题、变量名、变量意义、栏码位数、栏码序号和编码细则等,其中项目和问题就是指问卷上所列的调查项目或问题号码,变量名是用一个代号表示项目或问题号码,变量意义是对变量名的说明,编码细则是说明答案赋值和在编码时应该注意的问题。表8-14是根据表8-12部分内容编制的编码手册。

表8-12 “城市家庭教育方式与青少年行为偏差”栏码安排(节选)

续表

以上介绍的仅是资料初步编码或原始编码。在资料输入到计算机之后,还要根据研究的需要,对原始数据进行再编码,或者对原始数据重新分类、分组。例如,年龄资料输入到计算机之后,只是每个个案的年龄,还要进行年龄分组,然后再对各年龄组编码,即再编码。再编码可以使用SPSS软件中的Recode命令。对原始资料重新分组或分类,其关键是怎样对资料进行分类或分组,才能适合研究的需要。它既需要了解一般的统计知识和统计软件操作方法,更为重要的是,还需要了解研究者理论分析框架,使得统计分组或分类能够符合理论分析的需要。

表8-13 栏码和数据文件例举

表8-14 编码手册示例

续表