2.2.1 数据测度的分类

2.2.1 数据测度的分类

数据可以分为定量型数据、定性型数据和半定量数据,这是怎么定义和区分的?由于不同的事物能够进行计量或测度的程度不同,有些事物只能对其属性进行分类,如人口的性别、商品的型号等,这样的数据就是定性型数据;有些事物则可用数字来计量,如商品的质量和价格、人的身高等,这就是定量型数据。还有一些数据,性质介于前两者之间,数据带有次序的差别,这就是半定量数据,如学生的年级和受教育程度等。

根据计量学的一般分类方法,按照对事物计量的精确程度要求,可将所采用的计量尺度由高级到低级、由精确到粗略分为4个不同的层次,即定比尺度、定距尺度、定序尺度和定类尺度。采用不同的尺度来对事物计量,可以得到不同的数据,不同数据适用于不同的统计计算分析方法。

①刻度级(度量):可进行四则运算和基于此的延伸运算,它分为以下两个子级别。

a.定比级。定比级是数据最高级的测度等级。该等级的数据是具有一定单位的实际测量值,它的单位可以是尺、丈、米、斤、公斤、元等。这类数据可以做四则运算以及基于此的延伸运算。此时,要求其0值不是人为制定的,如长度的0米、资金的0元、重量的0斤等。只有当变量的0值不是人为制定时,其任意两个取值的比率(分母不为0)才能有确定的意义。在统计分析中,定比级的数据只能用数字来表示。定比级的数据有时也被称为比率级数据。

b.定距级。该等级的数据也被称为间距级数据,是只能做加、减运算,不能做乘、除运算的数据。其根本特征是,数据中的0不是物理世界客观存在的,是人为设定的。例如,如果室内是10摄氏度,室外是5摄氏度,那么我们可以计算室内、室外的温差,室内外的温差就是5摄氏度。但我们不能说10摄氏度是5摄氏度的2倍,因为把10摄氏度和5摄氏度转化为华氏温度后,就不是2倍的关系。

从定性变量和定量变量的角度来看,刻度级数据往往对应的是定量变量的变量值。

②定序级:也称为顺序级,是定序尺度,该级别的数据可以用数字来表示,也可以用字母来表示。但我们建议用数字表示,这样便于灵活应用。定序级的数据是只能够比较大小,而不能够做加、减运算,更不能做乘、除运算的数据。

例2.1 受教育程度这个定序级的变量可以采用以下数字表示:文盲半文盲=1,小学=2,初中=3,高中=4,大学=5。

③定类级:也称为名义级,定类尺度仅仅是一种标志,没有次序关系。该级别的数据可以用数字表示,也可以用文字表示。

例2.2 对于顾客的性别,可以用1表示男性,2表示女性。对于顾客喜爱的颜色,可以用红、橙、黄、绿、青、蓝、紫表示,也可以用数字1、2、3、4、5、6、7表示。