5.2.1 logistic回归模型

5.2.1 logistic回归模型

在许多实际问题中,因变量只有两个可能结果,也就是上面提到的二分类变量。这样的因变量在分析过程中可以使用虚拟变量来表示,一般取值为0或1。例如,在分析某企业客户流失情况时,可以把流失的客户记为1,未流失的客户记为0,针对这种因变量为二分类变量的情况,可以使用logistic回归模型进行分析。

logistic回归模型的基本形式如下:

但是在实际应用该模型时,往往不直接对P进行回归,而是先定义单调连续概率函数π,令

因此,logistic回归模型可以变形为

在R中可以使用glm()函数对0-1型变量进行logistic回归分析,示例如下:

其中,“family=binomial()”表明分布族服从二项分布,连接函数“link="logit"”表明要构建logistic回归模型。