5.3.4 k-折交叉验证实验与分析

5.3.4 k-折交叉验证实验与分析

为了进一步从机器学习和深度学习算法角度验证基于强化学习的社交网络话题内容匹配算法(MDPMS)的有效性,我们进行了k-折交叉验证实验。采用了5-折交叉验证,将所使用的新浪微博数据随机划分为5个大小相等且无交集的子集。根据交叉验证的要求,实验经过5轮进行,每轮取其中一个子集作为验证集,另外4个作为训练集。采用准确率对实验结果进行了评价,并选用了Rank Net,List Net,DSSM和CLSM4个基于深度学习的算法作为对比算法,评价结果如图5-5和表5-6所示。

基于强化学习的社交网络话题内容匹配算法(MDPMS)在5-折交叉验证评价准确率评价上优于其他对比算法。Rank Net算法和List Net算法分别致力于从成对学习和列表学习方面进行搜索排名以解决搜索问题。这两种算法的性能在第2次、第3次和第4次交叉验证期间,在新浪微博内容中搜索相关目标内容时,相对于第1次和第5次交叉验证的效果更好。DSSM算法和CLSM算法在最大化相关新浪微博内容点击率的基础上,从语义匹配的角度对社交网络安全话题相关内容问题进行建模。由于与传统网络搜索相比,以新浪微博为实例的社交网络的数据语义特征不同,因此这些算法无法满足社交网络的要求。

基于强化学习的社交网络话题内容匹配算法(MDPMS)采用强化学习马尔可夫决策过程来搜索与安全主题相关的内容,以构造适合于用户感知效用的搜索结果。在交叉验证过程中,基于强化学习的社交网络话题内容匹配算法(MDPMS)的评价效果表明了其在以新浪微博为实例的社交网络中进行安全话题相关的内容搜索任务的有效性。

表5-6 基于强化学习的社交网络话题内容匹配算法交叉验证平均准确率

图5-6 基于强化学习的社交网络话题内容匹配算法交叉验证准确率