二、变量的分类

二、变量的分类

1.二分法(binomial variable) 各类别之间无程度差别或等级关系,如阳性和阴性、治愈和未治愈等,以症状、体征或其他临床表现的出现或消失来衡量研究药物的疗效。二分法的常见变量有“成功”“效果”等,并需要有精确的说明。通常创建它们来描述类别,如性别(男/女)、国籍、教育程度。只有两个类别的那些被称为二进制变量。如果结果变量是分类的,还需要确定是否是“有序”的,即类别是否具有某种有意义的顺序,有序类别的例子包括教育水平(低/中/高)以及诸如“从不”“有时”和“总是”等调查的回应。无序的分类变量的例子是国籍、工作类型或婚姻状况。当分类变量具有明确的临床相关性时,是非常有用的。分类标准应在方案中预先定义,因为了解了试验结果以后很容易在选择这些标准时产生偏差。

2.连续变量(continuous variable) 连续变量几乎可以在一个范围内的任何值上。连续变量的例子是人的身高、年龄、BMI和血压。即使数值受到限制(如粗糙的测量设备使得测量值之间可能存在间隙),我们通常也可以将变量“建模”为连续的。

3.等级数据(ordinal variable) 等级数据将观察单位按某种属性的不同程度分组,统计各组的观察单位数目所得到的数据,如病情分轻、中、重,它们各类别之间存在着程度上的差别或等级关系。如对一批患者尿蛋白化验结果按-、±、+、++、+++分组,症状的无、轻、中、重,免疫学中抗体滴度等。其特点是各组之间既有等级顺序,又有程度与量的差别,故也称等级数据或半定量数据。临床分级表(clinical scales)主要用于主客观性的评估,可以分为三个等级:轻度(mild)、中度(moderate)、重度(severe)。

4.时间变量(time variable) 在特定情况下,长期治疗中的事件发生时间(time to event)的数据是有意义的。例如,事件发生时间的数据可以是从治疗到死亡的时间跨度,或肿瘤学中的肿瘤进展,也可以是恢复等正面的事件。在处理此类数据的研究中,通常需要预期大部分的随访损失(如通过治疗终止或与治疗无关的死亡)。这些研究的统计分析,通常使用生存分析方法。