8.1 引 言

8.1 引 言

在线社交网络为用户提供了轻量级的、快速的沟通和交流环境,用户能够利用社交网络平台传播和分享新闻事件、日常聊天及生活和工作状态情况。当用户从社交网络中搜索相关内容时,要求系统能够返回期望的结果,并根据其搜索意图进行推荐。为了实现上述目标,需要建立一种用户搜索意图理解的机制和算法,根据用户的信息理解和挖掘用户的搜索意图,最终返回符合用户搜索意图的搜索结果。利用在线社交网络用户和用户发布的信息,理解与挖掘用户的搜索意图对开发社交网络相关应用,如社交网络精准搜索、主题聚类和话题推荐具有重要的意义。

由于在线社交网络文本不规则并伴有大量的噪声,且存在上下文稀疏性问题,给在线社交网络用户搜索意图理解与挖掘带来了极大的挑战。在当前的用户搜索意图理解研究中,需要利用用户的隐私数据,如用户的搜索历史及访问日志等信息来进行研究,然而,用户隐私数据的获取是困难的。如何基于爬取的在线社交网络数据,从用户发布的内容中充分地理解与挖掘用户的搜索意图,降低普通词对用户搜索意图理解与挖掘的影响,并解决社交网络上下文稀疏性问题,是一个值得关注的挑战。

为了实现在线社交网络用户搜索意图的理解与挖掘,我们提出了基于用户聚合的在线社交网络用户搜索意图理解与挖掘算法(UAIU)。UAIU算法的主要目标是利用在线社交网络用户发布的信息,有效地从社交网络短文本中挖掘和理解用户的搜索意图,并处理在线社交网络上下文稀疏性问题。为了进一步提升理解与挖掘用户搜索意图的性能,利用伯努利分布作为开关变量对通用词和主题词进行区分,从而降低社交网络中大量通用词对用户搜索意图建模性能的影响。