8.2.1 UAIU算法的研究动机
2025年09月21日
8.2.1 UAIU算法的研究动机
在用户搜索意图理解与挖掘研究中,主题模型作为典型的建模方法受到广泛关注。然而,传统的主题模型在处理社交网络短文本信息时,无法解决上下文稀疏性问题,难以获取较好的搜索意图理解与挖掘的结果。为了解决上下文稀疏性问题,我们提出了多种改进的主题模型方法。隐主题模型(LTM)聚合短文本为长文档,解决社交网络上下文稀疏性问题。公共语义主题模型(CSTM)从公共主题中直接过滤噪声主题和词来增强主题词共现信息。上述方法分别以不同的视角来解决社交网络上下文稀疏性问题。然而,在线社交网络上下文是嘈杂和稀疏的,伴有大量的无意义的信息,这些方法无法主动区分主题词和通用词,因此,上述方法无法降低普通词对用户搜索意图理解与挖掘的干扰。
为了实现在线社交网络用户搜索意图理解与挖掘,需要考虑如何解决在线社交网络上下文稀疏性问题,并能够有效地降低非主题词的影响,提高用户搜索理解与挖掘的质量。另外,需要考虑如何在没有用户隐私数据的情况下,利用用户发布的信息实现具有通用性的在线社交网络用户搜索意图理解与挖掘算法。因此,本章提出了基于用户聚合的在线社交网络用户搜索意图理解与挖掘算法(UAIU),该算法通过构建在线社交网络用户聚合主题模型(UATM)对用户的搜索意图进行建模,基于建模的结果构建用户意图权重表示,并通过聚类得到的权重表示,实现在线社交网络用户搜索意图理解与挖掘。