连续变量的重新分组

二、连续变量的重新分组

如果我们需要将一个连续的变量分为几个等级,比如按照家庭的年收入,将它们分为“高收入家庭”“中等收入家庭”“低收入家庭”;又如按照学生的期末考试成绩,将他们分为“优秀”“良好”“中等”“及格”和“不及格”。在这个过程中,实际上创造了一个新的变量(“家庭收入等级”“成绩等级”),也可以认为是对原有变量(“家庭年收入”“期末考试成绩”)的重新编码。

接下来同样以“浙江××职业技术学院‘学评教’统计数据”为例,来说明连续变量的重新分组过程。现在需要将原来学生的成绩重新编码为“优秀”“良好”“中等”“及格”4个等级(由于此数据库中没有期末考试成绩在60分以下的学生,将“不及格”这个等级去掉)。4个等级的判断标准为:优秀即90—100分,良好即80—89分,中等即70—79分,及格即60—69分。注意:第一,各个等级同样要用数字来表示,如优秀为1,良好为2,中等为3,及格为4,不能直接用中文表示;第二,各个等级的判断标准不能有重合的部分,否则无法进行正确的分组。

具体操作如下:

点击工具栏[转换(T)]→[重新编码为不同变量(R)]或者[重新编码为相同变量(S)]→自动开启重新编码对话框→选中左边变量清单中的“学生期末平均分”变量,将其放入右边[输入变量→输出变量]下的方框中→在最右边,[输出变量]的[名称(N)]中填上新变量的名称“期末成绩等级”,然后点击[变化量(H)],此时[数字变量→输出变量]下方框中的文字会自动变成“学生期末平均分→期末成绩等级”→点击[旧值和新值]→自动开启“重新编码:旧值和新值”对话框中→在左边的[旧值]中选择[范围(N)],并在下面输入各个范围,如“90到100”→在右边的[新值]中输入新的编码,如“1”→点击[添加]→在添加完所有的新值和旧值后(见图6-24)点击[继续(C)]按钮→返回继续编码对话框后点击[确定]即可。

图6-24 重新分组编码

如果选择了[重新编码为不同变量(R)],则会出现一个新编码的变量“期末成绩等级”(见图6-25)。之后可以在变量视图窗口对这个变量的具体信息进行修改,特别是在[值]选项中设定每个数字代表的意义:1=优秀,2=良好,3=中等,4=及格。这样在后期的数据处理和分析中会让结果的显示更加清楚。

图6-25 新产生的“期末成绩等级”变量

【注释】

[1]本章所用的SPSS的版本为IBM SPSS Statistics 23.0。