数值型变量与分类变量

一、数值型变量与分类变量

按照数据的类型,可以将变量分为两大类:数值型变量和分类变量。

采用定距测量和定比测量得到的变量属于数值型变量。数值型变量根据数据的连续性,可分为两类:连续变量和离散变量。连续变量的取值范围可以是任意值,既可以是整数,也可以是小数,在相邻两个数值之间可被无限分割,例如,一个人的身高和体重;离散变量通常是整数取值的变量,例如班级的人数,一般是通过计数得到的。数值型变量的大小是可以比较的,而且可以进行加减运算,如A比B的成绩高10分,B比C的成绩高2分,那么A比C的成绩高了12分(10+2=12)。在SPSS中,将数值型变量称为标度变量。

采用定类测量和定序测量获得的变量属于分类变量,分类变量可分为顺序变量和名义变量。顺序变量是有大小的分类变量,例如考试的排名(在SPSS中称为有序变量);而名义变量是没有顺序的分类变量,例如性别、血型、户口类别等。分类变量是不能进行加减运算的。尽管第一名的成绩比第二名的好,第二名的成绩比第三名的好,但是,第一名和第二名之间的距离与第二名和第三名之间的距离是不同的。例如在前面的例子中,A,B,C分别是班上的第一名、第二名和第三名,第一名与第二名之间差了10分,第二名与第三名之间只差了2分。

我们在问卷调查中,经常会采用李克特量表等对某变量进行测量。用李克特量表测量的变量从严格意义上来说是顺序变量。由于分类变量是无法计算平均值或进行相关分析、T检验等统计分析的,因此为了方便解释和分析,我们将这类变量当成数值型变量来进行处理。