5.3.2 多类别回归模型的应用

5.3.2 多类别回归模型的应用

本小节介绍多类别回归模型的应用,以调查得到的某城市48个家庭的购房意愿及现状为例,如表5-3所示。其中,x 1表示家庭年收入,x 2表示家庭是否有孩子(1表示有孩子,0表示没有孩子),y表示家庭购房意愿及现状(y为分类变量,1表示没有购房打算,2表示已经购房但仍然在还房贷,3表示已经购房且无房贷)。以y为因变量,x 1、x 2为自变量,构建多类别回归模型,并估计家庭年收入为30万元且家里有孩子的家庭分别为以上1、2、3情况的可能性。

表5-3 家庭购房意愿及现状调查

续表

多类别回归模型的应用步骤如下。

(1)确定自变量和因变量,本例中x 1、x 2为自变量,y为因变量。

(2)使用nnet包中的multinom()函数构建多类别回归模型,代码如下:

运行上述代码,可得到多类别回归模型输出结果,如图5-6所示。

图5-6 多类别回归模型输出结果

(3)应用多类别回归模型,估计家庭年收入为30万元且家里有孩子的家庭出现上述三种情况的可能性,代码如下:

运行上述代码,得到结果如下:

由结果可知,当x 1=30,x 2=1时,y=1的概率约为0.003 1,y=2的概率约为0.750 4,y=3的概率约为0.246 5,因此,对于家庭年收入为30万元并且有孩子的家庭,目前没有购房打算的可能性约为0.31%;已经购房但仍然在还房贷的可能性约为75.04%;已经购房且无房贷的可能性约为24.65%。