5.2.1 基于强化学习的社交网络话题内容匹配算法研究动机

5.2.1 基于强化学习的社交网络话题内容匹配算法研究动机

基于强化学习的社交网络话题内容匹配算法(MDPMS)的贡献在于提出了通过动态社交网络内容相关性评价,从中间结果出发逐步构造与查询目标相匹配的搜索结果。当针对搜索结果位置选择不同社交网络内容作为结果时,构造的结果序列会发生变化,不同的结果序列在每个时间步骤下形成不同的搜索状态,最终通过强化学习算法训练以确保最终结果序列符合用户查询,并满足用户搜索效用。动态社交网络内容相关性评价用于计算动作值和利用不断改变的中间状态评估和动态强化搜索结果,通过训练深度学习算法在可变搜索状态下,动态地输出匹配相似度,并以此为依据来计算不同搜索排名位置上不同内容的排名分数,从而计算得到最终结果的搜索评价。实现了端到端的社交网络内容到符合用户搜索目标的搜索结果排名列表的映射,基于强化学习的社交网络话题内容匹配算法(MDPMS)将不同的动作值建模为强化学习后用户感知的效用,这使得搜索排名任务更加智能。