10.3.3 搜索结果的MAP评价与分析

10.3.3 搜索结果的MAP评价与分析

基于参数学习的结果与分析,对基于生成对抗学习的跨媒体社交网络搜索算法(CMSAL)中涉及的经验值依据实验评价结果进行赋值,以使算法发挥最优性能。对算法的搜索结果在MAP评价指标上进行进一步分析。

通过算法在新浪微博数据集、Wikipedia数据集和NUSWIDE数据集上的排在前5、前20和前50的搜索结果进行MAP评价,实验结果分别如表10-1~表10-3所示。

txt2img表示通过文本内容查询表达相同目标话题的图像内容,同理img2txt表示通过图像内容查询表达相同目标话题的文本内容。基于生成对抗学习的跨媒体社交网络搜索算法(CMSAL)在排在前5、前20和前50的搜索结果的MAP评价上优于对比算法,并在总体水平上优于所选取的对比算法。另外,通过实验结果可以看到,基于GAN算法比基于传统算法和基于DNN算法的性能有优势。基于GAN算法在特征生成方面具有一定优势,并在对抗学习机制下进行搜索特征匹配来实现信息搜索。该策略得益于通过对抗性学习探索跨媒体数据特征表示的语义分布。

由于基于传统算法立足于数据信息的浅层特征,无法适应社交网络内容信息的语义稀疏性而表现出较差的搜索性能。基于DNN算法则处于二者之间,基于深度学习全局语义的特征表示与公共语义空间的构建使其在以新浪微博为实例的社交网络内容搜索性能优于基于传统算法。然而基于DNN算法在内容全局语义特征表示的优势无法扩展到社交网络内容数据特性上,此类算法欠缺对社交网络内容语义稀疏性的良好优化。基于生成对抗学习的跨媒体社交网络搜索算法(CMSAL)一个优势是将自注意力(Self-Attention)机制应用于跨媒体社交网络内容信息局部语义特征的表示和分析上,来最小化社交网络内容语义稀疏性对内容搜索的影响。基于生成对抗学习的跨媒体社交网络搜索算法(CMSAL)的另一优势在于将跨媒体社交网络内容信息局部语义特征的表示和分析与对抗学习相结合,从而有针对性地进行跨媒体社交网络内容表示特征生成。

表10-1 在新浪微博数据集上搜索结果的MAP评价

续表

在Wikipedia数据集上的MAP评价结果显示了与在新浪微博数据集上相似的MAP评价数值分布,基于生成对抗学习的跨媒体社交网络搜索算法(CMSAL)在总体水平上优于所选取的对比算法。Wikipedia数据集上的MAP评价结果数值相对较小,形成这种情况的原因是在Wikipedia数据集下,跨媒体内容信息之间的映射关系被语义标签弱化,这种被语义标签弱化的跨媒体语义映射关系间接影响了最终的搜索结果,从而需要在不同媒体形式的数据特征之间建立相应的语义关联特征关系。在弱化跨媒体内容语义映射关系的前提下验证不同算法的跨媒体搜索性能是以Wikipedia为代表的公共数据存在的价值。

从基于生成对抗学习的跨媒体社交网络搜索算法(CMSAL)自身的搜索结果评价来看,相对于通过文本内容搜索图像内容,在通过图像内容搜索文本内容的任务中对搜索结果的MAP评价值更优。这种情况的原因是原始图像包含大量语义信息,这些信息将被提取并适当地表示,所提取卷积特征可以完全保留并详细呈现有价值的局部语义,而出于相同目的,文本的语义单元更简单。当利用具有更多语义信息的图像内容特征搜索具有目标语义的文本特征时,这个搜索任务的过程则变得更加可靠。

表10-2 在Wikipedia数据集上搜索结果的MAP评价

新浪微博数据集包含来自不同用户所创造的真实生活数据内容,这些内容包括书写随意,夹杂着新生词和自创词的文本内容和低分辨率的图像内容,形成了具有语义稀疏性的跨媒体语义信息内容。在新浪微博数据集上的搜索结果获得了更高的MAP评价值。与Wikipedia数据集相比,新浪微博数据集的MAP评价值高于其在Wikipedia数据集上的数值,主要是因为新浪微博数据集中的语义相对直接,例如文本中的部分词汇,直接概括了文本内容。

表10-3 在NUSWIDE数据集上搜索结果的MAP评价

新浪微博数据集中的局部语义特征相对集中和突出并具有语义代表性,基于智能化算法的学习算法可以相对容易捕捉到这些语义特性从而进行相关参数优化。但是,这些局部语义特征在跨媒体社交网络内容信息中的分布相对分散并且分布不均匀,使得基于生成对抗学习的跨媒体社交网络搜索算法(CMSAL)在算法训练过程中相对不顺利,这也是图10-5(a)中损失值在收敛过程中出现波动情况的原因。由于这种数据性质的存在,在微博数据集上对基于生成对抗学习的跨媒体社交网络搜索算法(CMSAL)的MAP评价中显示出较高评价值,但伴随着波动。

在NUSWIDE数据集上搜索结果的MAP评价方面,基于生成对抗学习的跨媒体社交网络搜索算法(CMSAL)在整体上优于所选择的对比算法。在NUSWIDE数据集上搜索结果的MAP评价展示了与在Wikipedia数据集上相似的数值分布。在NUS-WIDE数据集上,图像内容以简单的文本内容作为语义标签,从而简单明了地阐明了文本内容和图像内容之间的对应关系。同时文本内容既作为跨媒体内容的主体又作为文本内容与图像内容之间的语义关系。就文本内容数据质量而言,NUS-WIDE数据集简化了文本内容的语义信息,使得文本内容的语义特征既突出又明确。因此,作为公开数据集在NUSWIDE数据集上搜索结果的MAP评价与其在Wikipedia数据集上的数值分布呈现相似的特征。

NUSWIDE数据集上以文本内容本身作为跨媒体内容的语义标签,弥补了在Wikipedia数据集上文本内容和图像内容的语义关系弱化。NUSWIDE数据集上,基于生成对抗学习的跨媒体社交网络搜索算法(CMSAL)搜索结果的MAP评价整体上优于其在Wikipedia数据集上搜索结果的MAP评价,这也得益于NUSWIDE数据集的数据特性,尤其是其文本内容的数据避免对大量原始文本内容中包含复杂噪声语义信息的干扰,从而使得目标内容特征能够有效地进行提取并表示。