10.3.1 实验设置

10.3.1 实验设置

以新浪微博为社交网络实例,数据集采集自新浪微博,时间跨度为2012年6月10日—2016年9月7日。我们引入公共数据集Wikipedia和NUSWIDE来验证跨媒体社交网络内容搜索算法(CMSAL)。所选取的对比算法包括JFSSL,CMDN,DCCA,ACMR和CMGAN。对比算法根据理论基础被分为基于传统的算法、基于深度神经网络(Deep Neural Networks,DNN)的算法和基于GAN的算法。这些类别涵盖了跨媒体搜索算法研究的不同阶段。采用MAP和准确率作为搜索结果评价指标,对基于生成对抗学习的跨媒体社交网络搜索算法(CMSAL)在搜索性能进行评价。基于生成对抗学习的跨媒体社交网络搜索算法(CMSAL)将跨媒体社交网络内容关联分析算法(SSCM)作为跨媒体表示特征生成的核心,并且通过生成对抗学习将跨媒体社交网络内容关联分析算法(SSCM)对跨媒体社交网络内容的关联分析扩展为面向安全话题的社交网络跨媒体内容信息搜索算法。基于生成对抗学习的跨媒体社交网络搜索算法(CMSAL)描述如下所示。

算法10-1:基于生成对抗学习的跨媒体社交网络搜索算法

输入:社交网络文本嵌入特征和图像深度特征,用于搜索的社交网络内容特征集合

输出:搜索结果列表

(1)初始化跨媒体表示特征生成的参数矩阵

(2)初始化媒体内和媒体间判别限定的参数矩阵和跨媒体判别限定的参数矩阵

(3)运行跨媒体表示特征生成,重构跨媒体内容特征

(4)通过媒体内和媒体间判别限定计算媒体内语义损失进行媒体内特征分布度量

(5)通过媒体内和媒体间判别限定计算媒体间相似度损失进行媒体间特征分布度量

(6)通过跨媒体判别限定计算判别损失进行重构特征跨媒体判别

(7)依据步骤4~步骤6中计算的损失进行媒体内和媒体间判别限定和跨媒体判别限定运算参数优化更新

(8)将媒体内和媒体间判别限定和跨媒体判别限定的运算信息返回跨媒体表示特征生成形成判别对抗

(9)依据判别对抗信息进行跨媒体表示特征生成参数优化更新

(10)重复步骤3~步骤9直至跨媒体表示特征生成,媒体内和媒体间判别限定,跨媒体判别限定运算参数收敛

(11)保存优化后的运算参数

(12)载入优化后的运算参数到跨媒体表示特征生成,媒体内和媒体间判别限定,跨媒体判别限定

(13)载入搜索的社交网络内容特征

(14)针对目标内容特征在跨媒体表示特征生成中重构的跨媒体社交网络内容特征计算匹配相似度

(15)保存当前社交网络内容对应目标内容特征的相似度

(16)重复步骤13~步骤15直至处理完成

(17)依据相似度对保存的社交网络内容进行排名,形成搜索结果

(18)返回搜索结果列表