减少缺失值和无效值的方法与技巧

四、减少缺失值和无效值的方法与技巧

每一次问卷调查都要耗费大量的人力、物力和资金,特别是对于入户的一对一深度调查,每一个被调查者的获得都很难得,每一个调查数据的缺失或无效都会让研究者感到惋惜。为了减少缺失值和无效值,我们可以从以下几个方面进行改进。

(一)选择更合适的问卷调查方法

如前文所述,在马路上随机拉人的偶遇抽样,因为无法给被调查者提供舒适、宽松的答题环境,所以会导致问卷更容易出现缺失值和无效值。同样,自填式问卷因为依赖于被调查者自身的阅读和理解能力,所以也会增加出现缺失值和无效值的概率。一对多的问卷调查也会比一对一的问卷调查出现更多的缺失值和无效值。当然,每种问卷调查方法都各有优点和缺点,有些问卷调查方法虽然能大大减少缺失值和无效值,但是同样存在成本过高、操作难度过大等问题。因此,问卷调查方法的选择需要研究者根据自己研究的需要,以及对缺失值和无效值的容忍度进行衡量。如果在同等条件下,则应该选择能提高问卷回答质量的方法。

(二)设计更好的问卷

如上文所述,问题表达模糊是导致无效值的原因之一,因此在设计问卷时,要尽量让问题清晰,没有歧义。如对“您今年多大?____”这类问题,我们除了可以将其改为“您的年龄是?”以减少歧义外,还可以在这个回答问题的横线后面加上单位,如“您的年龄是?___岁”,以减少填写年份的可能性。当然,实际上,“您今年几岁”的问法仍然有歧义,因为这种问法会导致有些人填周岁,有些人填虚岁。如果继续改进,则可以改为“您的年龄是__周岁”。当然,另一种很好的问法是“您的出生年份是__年”,这样减少了被调查者在计算周岁的过程中可能造成的错误,同时也让这个问题的回答变得更加简单。调查员在回收数据后,只要将当年的年份减去被调查者的出生年份,就可以算出被调查者的年龄。此外,某些量表的设计可能导致出现“答题者惯性”,即针对同样类型的题目,选择了一样的答案。如表6-1所示的李克特量表,由于所有的问题都采取了非常类似的表达,出于惯性,被调查者在回答题目的时候,可能会大大缩短阅读题目的时间,飞快地看题并选择一样的答案,而完全没有意识到某些选择出现了错误(第5题)。

表6-1 容易出现“答题者惯性”的量表

为了减少这种情况,可以在量表中设置一些反向赋值的题,如表6-2中的第3题和第4题,使题目的意思表示和其他题目呈现相反的特征,让被调查者不得不减缓答题速度以进行更多思考,从而减少答题错误。

表6-2 打破“答题者惯性”的量表

(三)对调查员和数据录入者进行严格的培训

由于问卷调查和数据录入都是专业性的工作,因此需要对从事这两种工作的人员进行严格的培训。在对调查员的培训中,需要保证调查员已经对问卷非常熟悉,完全理解每一个题目的准确意思。针对数据录入者,则需要教授其数据录入的技巧和检查方法等。