4.3.3 实验二:SCSL与对比算法的MAP值比较
为了对基于时空特性的在线社交网络跨媒体语义学习算法SCSL的跨媒体语义学习能力进行研究,我们选取4种已有的跨媒体语义学习方法作为对比算法,在社交网络跨媒体数据集上进行跨媒体搜索实验,搜索类型分别为文本搜索图像(T-I)和图像搜索文本(I-T)。采用MAP值作为评价指标,返回结果数K分别为10,30,50,实验结果如表4-5所示。
在社交网络跨媒体数据集上进行文本搜索图像的实验中,基于时空特性的在线社交网络跨媒体语义学习算法SCSL与对比算法相比,在不同的K值下均取得了最高的MAP值。此外,深层语义学习方法Corr-AE、DCCA和SCSL算法均比浅层语义学习方法CCA和KCCA的搜索MAP值高,这是由于浅层语义学习方法仅能够学习模态间的线性映射关系,而深层语义学习方法能够学习到更加复杂的跨媒体数据之间的非线性映射关系,因此深层语义学习方法具有更好的跨媒体语义学习能力。
表4-5 SCSL算法与对比算法的搜索MAP值比较
在浅层语义学习方法中,KCCA算法优于CCA算法的搜索MAP值,这是因为KCCA算法在CCA算法的基础上进行了改进,通过核函数学习不同模态间的非线性映射关系,从而提升了跨媒体语义学习能力。在深层语义学习方法中,基于时空特性的在线社交网络跨媒体语义学习算法SCSL获得的MAP值最高,这是由于该算法在深度学习的基础上,改进了文本特征和图像特征的提取过程,通过建立在线社交网络多特征概率图模型,获取了高质量的文本语义表示。通过引入基于目标注意力机制的图像信息表达算法,获取了高质量的图像特征。因此,相比Corr-AE算法和DCCA算法对原始特征进行深度学习的方法,SCSL算法能够学习到更高质量的跨媒体语义。
在图像搜索文本的实验中,与对比算法相比基于时空特性的在线社交网络跨媒体语义学习算法SCSL在所有K值下均取得了最佳的MAP值。DCCA算法优于KCCA算法,由于DCCA采用深度学习的方法在公共空间中对图像特征和文本特征进行匹配,因此相比只进行浅层语义学习的KCCA算法,DCCA算法可以学习到更复杂的跨媒体数据映射关系。此外,基于时空特性的在线社交网络跨媒体语义学习算法SCSL的MAP值优于DCCA算法,说明在深层语义学习算法中,提升单模态特征的质量可以提高跨媒体数据的公共语义学习效果。
基于时空特性的在线社交网络跨媒体语义学习算法SCSL在文本搜索图像和图像搜索文本两类跨媒体搜索实验中的搜索效果均显著优于其他对比算法。特别地,相比对比算法DCCA,SCSL算法在文本搜索图像任务中MAP值平均提升了9.33%,在图像搜索文本任务中MAP值平均提升了13.20%。