10.3.4 搜索结果的准确率结果与分析

10.3.4 搜索结果的准确率结果与分析

采用准确率对基于生成对抗学习的跨媒体社交网络搜索算法(CMSAL)以及所选用的对比算法的搜索结果进行评价。准确率是搜索结果评价指标,在新浪微博数据集上的搜索结果前k名的准确率评价如表10-4和表10-5所示。

基于生成对抗学习的跨媒体社交网络搜索算法(CMSAL)在新浪微博数据集上的搜索准确率评价最优,并在文本搜索图像和图像搜索文本两种任务上优于所选取的对比方法。虽然随着考察范围的扩大准确率降低,但是基于生成对抗学习的跨媒体社交网络搜索算法(CMSAL)相对于所选取的对比算法依然存在优势。从算法种类角度来看,与MAP评价指标下的实验结果类似,基于GAN的算法比基于DNN的算法表现了更好的搜索准确率。原因在于基于GAN的算法相对于基于DNN的算法拥有更好的数据特征分布的模拟能力,因而能够在文本内容和图像内容之间进行有效的特征融合。基于GAN的算法大多以深度神经网络为基础,在此基础上通过Mini-Max损失定义,通过对抗训练机制在算法参数优化上取得优势,并在实际应用中取得良好效果。对于DCCA算法,针对跨媒体社交网络内容数据信息的非线性映射和规范相关分析学习相对独立,能够对跨媒体社交网络内容中目标话题内容进行分析学习。

表10-4 在新浪微博数据集上文本搜索图像结果的准确率评价

新浪微博数据集中的语义稀疏性需要具有鲁棒性的算法对高维矩阵表示下的新浪微博文本内容和图像内容进行有效语义特征挖掘,并针对混淆在语义噪声的局部语义进行学习,并构建紧致的特征空间。基于DNN的算法在此方面提供了通过复杂非线性映射来构造高维语义特征空间的算法基础,基于GAN的算法在此基础上针对跨媒体搜索问题,对文本内容和图像内容不同的语义特征表示和分布进行模拟,从而更加有效地实现了跨媒体匹配与搜索。

在Wikipedia数据集上的搜索结果准确率评价如表10-6和表10-7所示。基于生成对抗学习的跨媒体社交网络搜索算法(CMSAL)在新浪微博数据集上的搜索准确率评价最优,在Wikipedia数据集文本搜索图像和图像搜索文本两种任务上优于所选取的对比方法。在Wikipedia数据集上文本内容搜索图像内容实验结果的准确率评价在整体水平上高于在新浪微博数据集上文本内容搜索图像内容的实验结果。

表10-5 在新浪微博数据集上图像搜索文本结果的准确率评价

在相同的文本内容搜索图像内容任务下的实验结果,在Wikipedia数据集上,基于生成对抗学习的跨媒体社交网络搜索算法(CMSAL)与所选取对比算法之间的准确率差距相比于在新浪微博数据集上较小。说明所选用的对比算法在Wikipedia数据集上呈现出的搜索准确率相近,原因是Wikipedia数据集因其良好的数据性质使得不同的算法能够发挥其特性。其中,基于传统算法的JFSSL在两个数据上的性能差异相对明显,说明了基于传统算法的JFSSL对数据性质的依赖性,原因在于传统算法对结构化信息数据具有依赖性,对充满语义稀疏性的社交网络跨媒体数据缺乏鲁棒性。基于DNN算法和基于GAN算法由于其良好的学习性能和对全局语义特征分析与表示,在Wikipedia数据集上,通过文本内容搜索图像内容过程中体现了稳定的搜索评价结果。

表10-6 在Wikipedia数据集上文本搜索图像结果的准确率评价

通过对比在Wikipedia数据集上与在新浪微博数据集上图像内容搜索文本内容的准确率,体现了与文本内容搜索图像内容的结果相类似的情况。基于生成对抗学习的跨媒体社交网络搜索算法(CMSAL)与对比算法之间的搜索准确率差距被进一步缩小,图像内容所提供的语义特征相对丰富,通过深度学习算法可以充分挖掘和分析图像内容的语义特征,并构建用于查询的高维特征表示。即使在语义特征相对稀疏的社交网络图像内容中也可以充分利用这方面的优势来匹配语义特征相对简单且突出的文本内容语义特征,从而使得基于DNN算法和基于GAN算法在Wikipedia数据集上图像内容搜索文本内容的准确率相近。由于Wikipedia数据集的数据来源与新浪微博数据集的数据来源相似,从文本内容和图像内容的对应关系上,两个数据集展现出相似的跨媒体语义关联特性,从而通过Wikipedia数据集进行在线网络数据搜索匹配评价的数据依据具有一定说服力。

表10-7 在Wikipedia数据集上图像搜索文本结果的准确率评价

由于新浪微博数据集和Wikipedia数据集在数据形式上的差异导致了不同算法在两个数据集上的搜索准确率的差异,也充分证明了基于生成对抗学习的跨媒体社交网络搜索算法(CMSAL)对社交网络内容数据形式的良好适应性,以及针对社交网络中目标话题,尤其是安全话题内容搜索的有效性。通过在Wikipedia数据集上的实验,验证了基于生成对抗学习的跨媒体社交网络搜索算法(CMSAL)在处理跨媒体数据上的泛化性能,其不仅能够适应具有语义稀疏性的社交网络数据集,对具有普遍数据性质的数据也具有普适性。另外,Wikipedia数据集在跨媒体信息描述上具有与社交网络数据相似的性能,并削弱了语义标签的关联性能,体现了公共数据集对算法评价的可靠性。

在NUSWIDE数据集上的搜索结果准确率评价如表10-8和表10-9所示。

表10-8 在NUSWIDE数据集上文本搜索图像结果的准确率评价

表10-8展示了在NUSWIDE数据集上文本搜索图像结果的准确率评价。基于生成对抗学习的跨媒体社交网络搜索算法(CMSAL)在整体水平上优于所选择的对比算法。通过对比可以看出,在NUSWIDE数据集上文本搜索图像结果的准确率评价整体优于在新浪微博数据集和在Wikipedia数据集上进行评价的结果。另外,在NUSWIDE数据集上,基于传统算法和基于DNN算法进行文本搜索图像任务的搜索结果准确率评价也获得了较优的结果。这种结果印证了上文针对NUSWIDE数据集文本内容本身作为跨媒体语义标签对文本内容和图像内容之间的语义关联和文本内容语义特征分布特点的分析。由于NUSWIDE数据集的文本内容短小准确,使得文本内容的语义特征突出而集中,同时图像内容的语义标签使得NUSWIDE数据集的跨媒体语义关联更为紧密。在此情况下,使得基于传统算法能够有效发挥方法性能。通过复杂非线性映射,基于DNN算法也利用这一数据优势进行了更有利于跨媒体语义特征匹配的公共语义空间构造,从而也进一步充分发挥了深度学习算法优势。

表10-9 在NUSWIDE数据集上图像搜索文本结果的准确率评价

表10-9展示了在NUSWIDE数据集上图像搜索文本结果的准确率评价。基于生成对抗学习的跨媒体社交网络搜索算法(CMSAL)在整体水平上优于所选择的对比算法。在NUSWIDE数据集上图像搜索文本结果的准确率评价的整体数值变化趋势与在新浪微博数据集和Wikipedia数据集上相类似。但是由于数据集中数据的来源方式所决定的数据性质以及数据的组织关系使得算法在不同数据集上呈现了不同的实验效果。在NUSWIDE数据集上图像搜索文本结果的准确率评价再次印证了NUSWIDE数据集中将语义特征明确且突出的文本内容作为跨媒体数据语义标签对跨媒体内容搜索影响的分析。这一影响在NUSWIDE数据集上使得基于传统算法与基于DNN算法面向图像搜索文本的任务中准确率评价数值相接近,并使得基于GAN算法也充分发挥了其算法优势。