5.2.4 动态社交网络内容相关性评价
现有的信息搜索算法依赖于人工提取搜索特征来进行查询匹配和搜索排名。对于这些算法,搜索特征的质量直接决定了搜索算法的效率和可靠性,对人工提取过程提出了高质量的要求,并且需要大量的工作。此外,现有算法依靠查询与内容之间存在的交互作用来计算相关性分数,这个计算过程为静态的数值排名,忽略了搜索结果构造中间过程的评价和中间结果对最终结果影响。基于强化学习的社交网络话题内容匹配算法(MDPMS)结构致力于解决这个问题。作为信息搜索问题,对查询内容和目标内容进行相关性评价是获得搜索结果必不可少的过程,尤其是对具有特殊数据性质的数据网络内容。
社交网络内容的数据特性使得社交网络内容和所获得的特征表示具有语义稀疏性,也是区别于传统在线内容特征的关键点。为了在社交网络中进行内容搜索,首先需要对基于目标话题特征表达的局部语义特征进行处理。作为预处理,定义社交网络内容特征为多维特征向量,m=<w 1,w 2,…,w p>,其中w p∈R wd,每个社交网络内容特征向量的尺寸是一个固定值,w p为特征向量m在第p个维度上的特征。
为了学习社交网络内容特征的局部语义特征,利用面向社交网络内容特征向量和目标内容特征向量进行匹配特征挖掘,并生成紧凑的表示形式。然后将当前载入的社交网络内容特征与中间结果特征序列进行匹配结果序列评价,从而生成对当前载入的社交网络内容的动作选择,即“选择”或“跳过”该内容作为搜索结果的一部分。将所构成的中间结果序列返回给算法状态进行更新,获取评价信息,进一步强化动态社交网络内容相关性评价过程而产生更合适的动作值以构造符合目标内容的结果序列。动态社交网络内容相关性评价的框架图如图5-2所示。
图5-2 动态社交网络内容相关性评价框架图
将社交网络内容映射为高维特征向量,这里定义特征向量尺寸为wd×p×1,其中p为内容特征向量的维度,wd为每个维度上的特征向量维度,且二者均为经验值。与图像处理类似,在社交网络内容特征向量和查询目标内容特征向量上进行卷积和池化计算,对得到的结果进行序列特征构造,得到卷积特征表示。所采用的局部语义特征尺寸为「wd/2×1×1 024,采用卷积运算的覆盖范围为「wd/2+1
×2×1 024。社交网络内容特征在卷积和池化计算的协同作用下获得卷积特征表示。卷积特征表示同时涉及社交网络内容特征和查询目标内容特征,合并获得的特征与搜索结果序列特征,在动作值计算与结果序列评价作用下输出对当前社交网络内容特征向量的动作值。
在动作值计算与结果序列评价中考虑了内容序列的语义和时间依赖性,并提供了社交网络内容搜索结果构造的依据。动作值计算与结果序列评价的输入序列由一系列内容特征向量的组合构成,对这些内容经过评估以构建连续的语义和时间状态。初始化时,动作值计算与结果序列评价的输入序列向量为零向量,该序列随着时间步长的增长逐渐填充内容特征的非零向量。
匹配特征挖掘的目的是提取与目标话题相关的局部语义特征并构造特征表示。定义基于卷积计算的局部特征计算过程为*,社交网络内容特征为V c,卷积运算覆盖范围为F。图5-2中卷积层的计算过程如式(5-10)所示:
其中,S cr为输出特征向量,在社交网络内容特征为V c上覆盖的范围在第一个维度上为i到i+wd/2-1,在第二个维度上为j到j+p-1。
输出特征向量需要进一步进行池化运算对原始内容特征进行降维表示,定义如式(5-11)所示:
其中,S pr为池化层输出特征向量,激活函数采用Re LU,b ij为相应的偏置向量。基于强化学习的社交网络话题内容匹配算法(MDPMS)采用最大池化来实现池化计算,池化核的覆盖范围是在第一个维度上为i~i+wd/2,在第二个维度上为j~j+p-2。
在学习阶段,分析社交网络内容特征向量和目标内容特征向量,以使动态社交网络内容相关性评价对目标话题内容特征表示敏感。获得的卷积特征表示为R cf,与社交网络内容特征向量和目标话题内容特征向量同时相关联。利用动态社交网络内容相关性评价进行内容局部语义特征感知与计算,来处理社交网络内容特征和目标话题内容特征,目的是适应社交网络数据特性中的语义稀疏性,并充分挖掘局部语义信息。这种监督学习过程生成了社交网络内容和目标话题内容的卷积特征表示。为了提高语义信息的一致性,将动作值计算与结果序列评价用于分析社交网络内容与现有结果特征序列。动作值计算与结果序列评价的目标是产生适当的动作值,以指导强化学习算法做出适当的动作选择。
动作值计算与结果序列评价以长短记忆网络作为运算基础,定义结果序列中在时间步骤t下输入特征为i t,输出特征为ot在打开的状态时,输出状态h t可以接收到运算状态c t。当序列特征松散时,忽略上一个时间步骤t-1的内核状态ct-1。否则,对ct-1进行抑或融合运算。计算过程重复发挥了长短记忆网络在序列特征处理上的优势以保证动态社交网络内容相关性评价针对结果特征序列构造的有效性。将R cf_t作为原始输入,在基于强化学习的社交网络话题内容匹配算法(MDPMS)下,该输入也随着时间步骤进行更新以实现强化学习算法的优势。动作值计算与结果序列评价计算过程如式(5-12)所示:
其中,符号σ为sigmoid激活函数,符号◦表示Hadamard积。W和b是在相应时间步骤下的权重矩阵和偏置向量。动作值计算与结果序列评价在输出段以softmax作为输出层分类器来获取输出在动作选择上的概率分布。依据这个概率,动态社交网络内容相关性评价的最终输出将函数的值映射为“选择”和“跳过”的动作值分布。