3.3.4 CAIE算法的实验结果与分析

3.3.4 CAIE算法的实验结果与分析

1.实验设置

(1)数据集

从每个事件的图像数据中挑选2 500张图像作为实验数据集,取其中的2 000张图像数据用于训练,其余的500张图像用于测试。

(2)评价指标

为了验证基于互补注意力机制的在线社交网络图像主题表达算法的性能,将CAIE算法和其他对比算法的图像主题表达结果用于搜索任务,通过搜索的评价指标来验证CAIE算法的图像主题表达性能。分别采用归一化折损累计增益(NDCG)、平均准确率(MAP)作为评价指标。

2.实验一:CAIE算法与对比算法在社交网络图像数据集中的搜索实验

通过测试集中的数据进行搜索实验,选择MAP@K和NDCG@K来进行评价,MAP@K表示搜索结果中前K个结果的MAP值,同理,NDCG@K表示搜索结果中的前K个结果的NDCG值,其中K的取值分别5、10、15和20。

在社交网络搜索的平均准确率MAP指标上,CAIE算法显著优于其他对比算法,尤其当K取值为10时,CAIE算法的平均准确率超过0.8,CAIE算法的MAP结果比对比算法mm LDA、M 3R、VELDA、mmETM及VGG-19分别提升了26%、19%、15%、9%和4%。上述结果表明,基于互补注意力机制的在线社交网络图像主题表达算法(CAIE)能够有效地对图像主题进行表达,进而能够有效地提升在线社交网络图像搜索的性能。

为了进一步验证CAIE算法与其他对比算法的图像表达的效果,在同样数据集和参数设置下,利用NDCG作为评价指标来验证CAIE算法和其他对比算法的搜索性能,实验结果如图3-8所示。

图3-8 CAIE算法与对比算法在新浪微博图像数据集上的NDCG值比较

从图3-8的搜索实验结果可以看到,CAIE算法的NDCG值显著优于其他对比算法,VGG-19算法搜索结果的NDCG值优于mm LDA、M 3R、VELDA和mmETM算法。基于传统主题模型的mm LDA算法获取了最差的搜索性能。实验表明,基于深度学习的算法通过对图像特征更加深入的刻画和表达,有助于提升图像主题表达的质量,进而在搜索性能上有较大的提高。而其他三种主题模型算法虽然也能够有效地完成图像主题的表达,但其仅对图像进行简单的关联和建模,无法实现细粒度的图像主题表达。

基于互补注意力机制的在线社交网络图像主题表达算法搜索结果的NDCG值和MAP值均优于VGG-19算法,表明CAIE算法通过提取聚焦特征和非聚焦特征,并通过目标特征对其进行引导,可以获取到比全局特征更加聚焦的特征,通过特征互补,使得其获得更加精细的图像特征。

3.实验二:权重参数对CAIE算法主题表达性能的影响

聚焦特征和非聚焦特征融合的权重参数的变化影响着图像主题表达的性能,为了充分验证权重参数κ对图像主题表达的影响,通过利用新浪微博图像数据,采用MAP作为评价指标,验证权重参数κ变化对CAIE的性能的影响。权重参数κ变化范围为0~1,K的取值分别为10和20。权重参数κ对CAIE算法主题表达性能影响的实验结果如图3-9所示。从实验结果可以看到,聚焦特征和非聚焦特征对图像主题表达的性能有较大影响,且在κ等于0.6时,MAP@10和MAP@20的结果表现最好,表明当聚焦特征为0.6,而非聚焦特征为0.4时,可以实现图像主题表达的最佳效果。

图3-9 CAIE算法在不同权重参数κ设置下的MAP结果比较