5.1 引 言
社交网络内容搜索问题引起了信息搜索研究人员的广泛兴趣。集成了智能应用程序模块的智能移动设备在高效的移动互联网环境下,使得社交网络得到了飞速发展,并使得关于各种话题内容的信息在社交网络平台上爆炸式增长。人们通过各种社交网络平台以短文本、图像和简短视频等媒体形式对生活经验、身边故事和社会事件进行分享。在这些社交网络平台上,相应的社交网络内容信息已成为新闻和生活经验的重要来源。通过这些信息,用户对安全话题内容的看法和观点凭借话题的敏感性在社交网络中迅速传播,因此从社交网络中搜索有关安全话题有关的有用信息变得越来越重要。
社交网络中以各种数据形式存在的内容涉及用户发布在社交网络中与紧急事件或灾难事件有关的描述或讨论。从数据功能或统计特性的角度来看,这些内容信息与其他社交网络内容之间没有区别。基于用户感知效用来适当地搜索微博客内容以寻找目标主题是社交网络信息搜索领域中的热点。
社交网络内容独特的数据特性给社交网络信息搜索带来了极大的挑战,其主要原因在于社交网络内容的语义稀疏性。解决社交网络搜索问题的关键困难之一是在具有语义稀疏性的数据中准确地匹配与查询目标话题相关的信息。研究人员已经基于短文本检索算法进行了社交网络搜索。匹配过程作为搜索问题的一个重要环节是决定搜索结果与查询内容是否贴合的关键。因此,如何在充分考虑用户感知效用的同时进行社交搜索是另一挑战。
本章提出了一种基于强化学习的社交网络话题内容匹配算法(MDPMS)并用于搜索以新浪微博为实例的社交网络内容信息。MDPMS算法中包括一种基于深度Q网络(Deep Q Network,DQN)的动态社交网络内容相关性评价。MDPMS算法遵循马尔可夫决策过程(Markov Decision Process,MDP),其中我们将搜索结果的每个中间结果视为一个单独的状态,并依据MDP的标准强化学习算法构建了符合搜索需求的结果序列。
从信息搜索的角度来看,可以将动作值(Action Value)这一强化学习概念用作搜索结果的中间结果匹配度的评价参考。结合初步构成的结果序列特征,作为动态社交网络内容相关性评价的关键部件,根据内容特征表示序列为每个社交网络内容特征计算参考动作值。参考动作值用于选择动作:是否将当前内容作为搜索结果加入结果列表中。对于复杂的社交网络数据内容语义特征,利用特征运算将特定局部语义特征压缩为低维语义表示。
动态社交网络内容相关性评价由卷积神经网络和长短期记忆网络作为运算器,对所输入的社交网络内容特征和通过动态社交网络内容相关性评价选取相应内容作为搜索结果。运用卷积神经网络的高效特征运算针对社交网络内容构造表示特征,以及长短期记忆网络中对构造的搜索结果序列特征进行有效运算,将搜索过程的每个中间结果序列视为一个单独的状态结果进行动态相关性评价,使得所构造的搜索结果逐步与查询内容相匹配并满足用户的搜索感知效用。结合用户感知效用的概念,与传统信息搜索评价指标相结合,对基于强化学习的社交网络话题内容匹配算法(MDPMS)的搜索结果进行测评。