6.2.5 基于语义相关性分数的话题搜索
为了实现用户对在线社交网络话题的搜索,现有的方法大多基于话题的热度对话题进行排序,忽略了话题标签与用户的查询项之间的相似度。本章通过计算话题标签的相关性分数对话题标签进行排序实现话题的搜索。
根据用户-话题标签主题模型(UHTME),可以获取用户的主题表示、话题标签的主题表示以及单词的主题表示,基于上述主题表示可以计算得到每个话题标签的语义相关性分数,即用户在进行在线社交网络话题搜索时可能返回的话题标签的概率。
该过程可以形式化表示为:给定用户的搜索项m,其中包含
个单词{w 1,w 2,…,
,根据学习到的参数θ,φ,ϕ,计算每个候选话题标签的语义相关性分数。查询项的候选话题标签集H C中的每个话题标签
的语义相关性分数SRS可用式(6-11)计算:

其中
表示话题标签h i属于主题k的概率,θu,k表示该用户被分配给主题k的概率,ϕk,w表示每个单词属于主题k的概率。基于式(6-11)计算每个候选话题标签的语义相关性分数。对语义相关性分数进行排序,生成Top-T话题标签作为话题搜索的结果。