7.4.5 训练

7.4.5 训练

为了验证XGBoost算法,我们使用了3种有监督的机器学习算法:logit模型(lr)、xgboost(xgb)、catboost(cb)。为了对以上分类模型进行评价,采用正确率(accuracy)、精度(precision)、召回率(recall)、Fl分数(Fl score)进行评估,其计算公式如式(7-14)、式(7-15)、式(7-16)、式(7-17)所示:

图示

其中,TP为被分类器正确划分为正例的个数,FP为被分类器错误地划分为正例的个数,TN为被分类器正确地划分为负例的个数,FN为被分类器错误地划分为负例的个数。

情绪状态检测是一个多元分类的问题,我们打算将一个人在给定时间内的情绪状态分为以下6类:①不和谐;②高兴;③劝阻;④激起;⑤顺从;⑥强势。每个模型的超参数是通过在参数网格上分层交叉验证网格搜索确定的。在一般的模型中,我们使用了一个6倍的、3个人的交叉验证,在每一个折叠中,模型根据15个人的数据进行训练,并在剩下的3个数据点上进行测试。通过优化F1评分调整超参数。(https://www.daowen.com)

由表7-2可知,XGBoost相对于其他模型具有较好的表现。这将有助于减少传统筛查中对学生自我报告的依赖,实现对学生日常情绪的无缝跟踪及情绪异常变化的提前感知,具有更好的应用性。

表7-2 情绪状态检测表

图示