SPSS对缺失值的置换

2025年11月28日

版权

三、SPSS对缺失值的置换

下面以“××职业技术学院‘学评教’统计数据”为例，来看下如何以平均值代替缺失值。如图6-14所示，在现有的数据中，名字叫周九的同学的“学生评教分数”是缺失值，用数列平均值的方法对缺失值进行置换的操作如下：

pagenumber_ebook=137,pagenumber_book=124

图6-14　××职业技术学院“学评教”统计数据

点击工具栏［转换（T）］→［替换缺失值（V）］→自动开启替换缺失值的对话框（见图6-15）→选择左边变量清单中的“学生评教分数”变量，将其放入右边［新变量（N）］下的方框中→在［名称（A）］选项的方框中输入新变量的名称（系统也会自动生成默认的新变量名称“学生评教分数_1”）→在［方法（M）］选项的下拉菜单中选择［序列平均值］，再点击［变化量（H）］→点击［确定］即可。

pagenumber_ebook=138,pagenumber_book=125

图6-15　“替换缺失值”对话框

备注：在［方法（M）］选项的下拉菜单中，也可以选择其他数值对缺失值进行置换。［序列平均值］是指整列数据的平均值，也就是这一变量所获得的有效数据的平均值。［邻近点的平均值］是缺失值前后数值的平均数，可以在下面［邻近点的跨度］中设置邻近点的个数，如设置为1，就是取缺失值前后的1个有效数值的平均值作为缺失值的数据；如果设置为2，就是取缺失值前后的两个有效数值的平均值作为缺失值的数据。［邻近点的中位数］是以缺失值前后数据的中位数作为缺失值的数据。［线性插值］和邻近两点的平均值的原理是一样的，也是选择缺失值前后两个数值的平均值作为缺失值的数据。［邻近点的线性趋势］是用简单线性回归方程的原理，通过已有数据建立回归方程，再估算出缺失值的数据。

完成操作后的数据如图6-16所示，在“学生评教分数_1”这个新变量中，周九的分数已经用序列平均值81.3进行了置换。

pagenumber_ebook=139,pagenumber_book=126

图6-16　进行平均值替换后的成绩显示