SPSS对缺失值的置换

三、SPSS对缺失值的置换

下面以“××职业技术学院‘学评教’统计数据”为例,来看下如何以平均值代替缺失值。如图6-14所示,在现有的数据中,名字叫周九的同学的“学生评教分数”是缺失值,用数列平均值的方法对缺失值进行置换的操作如下:

图6-14 ××职业技术学院“学评教”统计数据

点击工具栏[转换(T)]→[替换缺失值(V)]→自动开启替换缺失值的对话框(见图6-15)→选择左边变量清单中的“学生评教分数”变量,将其放入右边[新变量(N)]下的方框中→在[名称(A)]选项的方框中输入新变量的名称(系统也会自动生成默认的新变量名称“学生评教分数_1”)→在[方法(M)]选项的下拉菜单中选择[序列平均值],再点击[变化量(H)]→点击[确定]即可。

图6-15 “替换缺失值”对话框

备注:在[方法(M)]选项的下拉菜单中,也可以选择其他数值对缺失值进行置换。[序列平均值]是指整列数据的平均值,也就是这一变量所获得的有效数据的平均值。[邻近点的平均值]是缺失值前后数值的平均数,可以在下面[邻近点的跨度]中设置邻近点的个数,如设置为1,就是取缺失值前后的1个有效数值的平均值作为缺失值的数据;如果设置为2,就是取缺失值前后的两个有效数值的平均值作为缺失值的数据。[邻近点的中位数]是以缺失值前后数据的中位数作为缺失值的数据。[线性插值]和邻近两点的平均值的原理是一样的,也是选择缺失值前后两个数值的平均值作为缺失值的数据。[邻近点的线性趋势]是用简单线性回归方程的原理,通过已有数据建立回归方程,再估算出缺失值的数据。

完成操作后的数据如图6-16所示,在“学生评教分数_1”这个新变量中,周九的分数已经用序列平均值81.3进行了置换。

图6-16 进行平均值替换后的成绩显示