《在线社交网络搜索与挖掘》简介
《在线社交网络搜索与挖掘》这本书是由.杜军平等著创作的,《在线社交网络搜索与挖掘》共有171章节
1
内容简介
在线社交网络积累了大量用户产生的文本、图像和视频等跨媒体数据,而且数据呈现出显著的时空演化特性,这使得传统的搜索与挖掘技术已经难以适应用户在海量在线社交网络数据...
2
前 言
在线社交网络是一类可以帮助用户建立在线好友关系网络,并且可以在好友间分享兴趣、爱好、状态和活动等信息的在线应用服务,具有强大的信息发布、传播、获取以及分享功能。...
3
目录
目 录 内容简介 前 言 第1章 在线社交网络跨媒体时空信息的获取与表达 1.1 引 言 1.2 在线社交网络跨媒体时空信息的获取与预处理 1.3 基于时空主题...
4
第1章 在线社交网络跨媒体时空信息的获取与表达
...
5
1.1 引 言
在线社交网络平台中存在大量的时空信息,以新浪微博中的微博消息为例,在一条微博中,除了文本、图像URL以及话题标签等微博内容外,还包括时间、空间和发布该微博的用户...
6
1.2 在线社交网络跨媒体时空信息的获取与预处理
利用开源的分布式爬虫算法对新浪微博数据进行分布式爬取。对于每条消息,根据其时间信息确定微博的时间范围,将发布该消息的用户在此时间范围内发布的所有微博收集到实验数...
7
1.3 基于时空主题模型的在线社交网络文本信息表达算法(OSNTR)的提出
本章提出的基于时空主题模型的在线社交网络文本信息表达算法(OSNTR),构建了在线社交网络时空主题模型,对时间信息、空间位置信息和双词特征进行了统一建模,并将上...
8
1.3.1 OSNTR算法的研究动机
在线社交网络消息在不同时空情境下的含义不同,为了对在线社交网络信息进行准确的语义表达,需要同时考虑文本信息、时间信息和空间位置信息。在线社交网络中的文本消息较短...
9
1.3.2 在线社交网络时空主题模型(STTM)的建立
为了实现在线社交网络时空信息的表达,我们建立了在线社交网络时空主题模型(STTM),如图1-2所示。其中,阴影表示的变量是可观测变量,非阴影形式表示的变量是需要...
10
1.3.3 时空区域、时间以及单词的主题分布
在线社交网络时空主题模型(STTM)经过推理可以得到时空区域-主题分布θr、主题-时间分布ψ与主题-单词分布φW。通过以上三种分布将时空区域特征、时间特征与单词...
11
1.3.4 在线社交网络消息的文本主题语义表达
通过在线社交网络时空主题模型(STTM)可以获得整个时空文档的主题分布以及主题在单词上的分布,但是并不能直接得到每条在线社交网络消息中的文本的主题分布。因此,需...
12
1.3.5 在线社交网络消息的时间主题语义表达
采用在线社交网络时空主题模型(STTM)可以获取时空区域主题分布、主题-单词分布与主题-时间分布,并推理得到在线社交网络消息的文本的主题分布。每条在线社交网络消...
13
1.3.6 OSNTR算法的实现步骤
基于时空主题模型的在线社交网络文本信息表达算法(OSNTR)的实现步骤如下所示。 算法1-1 基于时空主题模型的在线社交网络文本信息表达算法 输入:主题数K,狄...
14
1.3.7 OSNTR算法实验结果与分析
我们对本章提出的基于主题模型的在线社交网络时空信息的获取与表达算法(OSNTR)从两个方面来分析其有效性。一方面对在线社交网络时空文本信息的表达方法(OSNTR...
15
1.3.8 OSNTR算法的复杂度分析
以下对本章提出的OSNTR算法的时间复杂度和空间复杂度进行分析,并将其与主题模型LDA和BTM的时间复杂度和空间复杂度进行对比。 (1)时间复杂度 LDA模型的...
16
1.4 基于目标注意力机制的在线社交网络图像信息表达算法(IROA)的提出
本节提出一种基于目标注意力机制的在线社交网络图像信息表达算法(IROA),基于爬取的在线社交网络图像数据,利用结构推理网络SIN提取了图像中存在的多个目标特征,...
17
1.4.1 IROA算法的研究动机
每个图像包含多个显著性区域,而目标特征仅与图像的部分区域相关。在基于目标注意力机制的在线社交网络图像信息表达算法(IROA)中构建了视觉目标注意力机制,将图像区...
18
1.4.2 IROA算法描述
我们建立的目标注意力机制将原始图像划分为不同区域,通过目标与图像区域的相关性,实现目标特征指导下的图像特征生成。对图像特征进行表示,并选择其最后一个池化层的输出...
19
1.4.3 IROA算法的实现步骤
基于目标注意力机制的在线社交网络图像信息表达算法(IROA)的实现步骤如下所示。该算法以VGG-19模型为基础,通过提取目标特征,计算每个目标特征在不同图像区域...
20
1.4.4 IROA算法实验结果与分析
1.实验设置 本节采用的图像数据来源于4个社交网络安全事件数据集,根据每个社交网络消息中的图像URL对图像进行爬取和筛选。为了保证不同事件中的图像数量均衡,在每...
21
第2章 跨媒体社交网络内容获取与处理
...
22
2.1 引 言
社交网络作为当今社会重要的公共信息发布平台,包含了大量的来自社会各界用户所发布的信息,其中包括国外国内新闻等重要信息。随着社交自媒体时代的到来,借助发达的互联网...
23
2.2 跨媒体社交网络内容数据获取与预处理
依据网络爬虫理论对社交网络平台的跨媒体数据信息进行获取,本节以新浪微博作为社交网络数据来源和具体实例展开。首先,构建了用户—智能体(User-Agent,UA)...
24
2.3 跨媒体社交网络内容关联分析算法的提出
本章提出的基于自注意力(Self-Attention)机制的跨媒体社交网络内容关联分析算法(SSCM),基于自注意力机制进行了社交网络安全话题语义挖掘,对社交网...
25
2.3.1 跨媒体社交网络内容关联分析算法研究动机
跨媒体社交网络内容关联分析是跨媒体社交网络内容搜索的必要工作,本节的贡献在于提出了跨媒体社交网络内容关联分析算法(SSCM),利用自注意力(Self-Atten...
26
2.3.2 跨媒体社交网络内容关联分析算法的形式化定义
为了实现在社交网络中针对相关文本内容信息和图像内容信息进行关联分析处理,并构建跨媒体社交网络内容的信息关联,我们提出了基于自注意力机制的跨媒体社交网络内容关联分...
27
2.4 社交网络深度学习搜索特征抽取与匹配算法的提出
本节提出一种社交网络深度学习搜索特征抽取与匹配算法(DCNN-CSTRS),对跨媒体社交网络内容关联分析算法(SSCM)所重构的跨媒体社交网络关联特征,针对查询...
28
2.4.1 社交网络深度学习搜索特征抽取与匹配算法研究动机
传统信息搜索算法框架受制于内容信息索引和匹配机制的运算局限性,在大规模数据信息下的索引机制和匹配运算呈现了低效率的现状。另外,在社交网络内容数据特性的影响下,社...
29
2.4.2 社交网络深度学习搜索特征抽取与匹配算法的形式化定义
算法(DCNN-CSTRS)通过深度学习中的深度卷积神经网络,从重构得到的跨媒体社交网络内容关联特征层面上对社交网络内容信息进行了特征抽取与匹配。算法框架图如图...
30
2.5 实验结果与分析
...