5.4.2 多类别定序回归模型的应用
2025年09月26日
5.4.2 多类别定序回归模型的应用
在多类别定序回归模型的应用中,我们使用MASS包自带的housing数据集(部分),如图5-7所示。
图5-7 housing数据集(部分)
housing数据集为哥本哈根住房情况的调查数据,共有72条,本小节只选取其中的一部分。其中,Sat为定序变量,表示居民对目前住房的满意程度(Low、Medium、High);Infl表示居民认为物业管理的影响程度(Low、Medium、High);Type表示居民住房的类型(Tower、Apartment、Atrium、Terrace);Cont表示居民与其他住户的沟通程度(Low、High);Freq表示每条数据对应的居民人数。
接下来,对上述数据进行多类别定序回归分析。多类别定序回归模型的应用步骤如下。
(1)确定自变量和因变量,本例以Sat为因变量,以Infl、Type、Cont为自变量。由于Freq表示每条数据对应的居民个数,因此在分析中将Freq作为权重。
(2)使用MASS包中的polr()函数构建多类别定序回归模型,代码如下:
运行上述代码,可得到多类别定序回归模型输出结果,如图5-8所示。
图5-8 多类别定序回归模型输出结果
(3)接下来进行显著性检验,代码如下:
运行上述代码,可得到显著性检验结果,如图5-9所示。
图5-9 显著性检验结果
显著性检验结果表明,3个变量对居民满意度的影响在0.1%水平上显著。
(4)应用回归模型,输出有序变量的预测值,并与真实值进行比较,代码如下:
运行上述代码,可得到预测值与真实值的对比结果,如表5-5所示。
表5-5 预测值与真实值对比结果
续表
由对比结果可知,构建的多类别定序回归模型的预测准确率约为33.3%,效果并不理想。