15.3.2 数据的相关性分析

15.3.2 数据的相关性分析

在开展回归分析之前,需要进行数据的相关性分析,以检验回归分析选取的自变量与因变量之间是否存在显著的相关关系。

首先,构造相关性分析矩阵和0-1变量,用于区分会员与非会员,非会员为0,会员为1。构造0-1变量的代码如下:

然后,针对数据集开展相关性分析,代码如下:

相关性分析结果显示,用户的关注数、粉丝数、微博数、用户等级、活跃天数、年龄、使用时长与注册成为会员显著相关。