缺失值和无效值的处理逻辑

二、缺失值和无效值的处理逻辑

面对已经存在的缺失值和无效值,我们应该如何进行处理呢?首先是要将无效值转变成缺失值,我们在上一节中已经介绍过变量视图中的“缺失”选项,对于一些无效值可以通过该选项让系统将其默认为缺失值。如果询问的是年龄,那么就可以在“缺失”选项中,将这个答案的范围限定为“下限0,上限100”,这样凡是小于0和大于100的答案都会被默认为缺失值。

SPSS中的缺失值,会在单元格中以“.”符号表示,意思就是这个值是空白的,没有被录入。对于缺失值总体上有两种处理办法。

第一种是直接删除。在SPSS的各种分析功能中,如果该统计分析方法需要考虑缺失值这一因素,则会在分析功能窗口出现“选项”按钮,点击后会出现处理缺失值的方法,有[按具体分析排除个案(A)][按检定排除个案(T)][按成对方式排除个案(P)][成列排除个案(L)]。一般情况下,不同的统计分析方法在缺失值的处理上都会有一个默认的选项,会自动对缺失值进行处理。

第二种是以平均值或中位数进行置换,就是用该问题回答的平均值或中位数来代替缺失值,这样可以保证数据库中各个数值都可以被完整地体现出来,具体操作见下文。