15.3.4 数据的生存回归分析

15.3.4 数据的生存回归分析

生存回归分析又称比例风险回归分析,简称为Cox回归,是由英国统计学家戴维·罗斯贝·科克斯(David Roxbee Cox)于1972年提出的一种半参数回归模型。该模型以生存结局和生存时间为因变量,可同时分析众多因素对生存期的影响。该模型多用于医学领域,条件合适的情况下,也可在其他领域预测事件发生的可能性。本研究设定的一个研究问题是:UGC用户的行为差异将对普通用户向会员用户的转换速度(多快成为会员)产生怎样的影响?为此,本节选用生存回归分析方法对该问题进行研究。

在R语言中,可以使用survival包进行生存回归分析,示例代码如下:

使用stargazer()函数查看回归分析结果的示例代码如下,输出结果如图15-8所示。

图15-8 生存回归分析结果

生存回归分析结果如下。

在用户参与层级方面,关注数系数略大于1,说明相较于关注数少的普通用户,关注数多的普通用户成为会员用户的速度更快;微博数系数和粉丝数系数均等于1,说明微博数和粉丝数对普通用户成为会员用户的速度没有影响。这表明用户的社区参与程度是影响普通用户成为会员用户速度的主要因素,而内容生产和社区领导对普通用户成为会员用户的速度几乎没有影响。

在个人信息层面,女性普通用户相对男性普通用户,成为会员用户的速度更快,与之前的逻辑回归结果相结合,可以推断的是,具有较为明显的性别(偏女性)特征的新浪微博普通用户不仅成为会员用户的可能性更高,而且付费成为会员用户的速度更快。

在用户等级层面,用户活跃天数系数小于1,说明相较于活跃天数长的普通用户,微博活跃用户中活跃天数短的普通用户成为会员用户的速度更快。这表明普通用户转变为会员用户有一定的时间窗口,如果错过这一时间窗口,用户的付费意愿将会明显降低。