6.2 网络舆情涨落的探知研究

6.2 网络舆情涨落的探知研究

上文我们研究了网络舆情涨落的微观机制,但事实上,这些要素并没有那么容易获取到或者获取全面。通过调查进行统计是一个好方法,不过其工作量很大,也并非本书的重点。因此下文将介绍我们如何站在宏观的层面去探究网络舆情的涨落。

时间维度是从宏观的表象层面去呈现网络舆情的演化涨落情况的。宏观层面的演化涨落不仅对于舆情演化的态势预测很重要,更重要的是,可以方便研究者定位需要用“放大镜”来从微观层面进行深入分析的时间点。定位方式很直观也很简单,即定位到演化曲线的峰值点,并可以根据具体需要将时间粒度进行调整,如周、天、小时等,进而重点分析峰值点的前置时间环节。当然,按照舆情生命周期来研究其传播(李明德,2014),本质上也是对时间维度的演化分析。

用户维度是从用户(即生产者和消费者)网络的角度,探寻网络舆情演化过程中的关键激励节点。一般情况下,研究者对用户维度的分析并不是孤立进行的,而是常结合时间维度一起进行。在不同的时间截断面上,网络舆情的用户网络不尽相同。随着时间的推移,用户网络中经常会出现新的hub节点。并且,正是这些“黑马”hub节点,才需要我们格外去关注。一旦定位了一些关键的hub节点,研究者就可以借助于这些节点的ego-net进行溯源分析,挖掘舆情演化涨落的微观激励要素。

媒体维度和用户维度存在极强的同质化,无论是研究方式方法还是其他方面都是如此。在微博等平台,用户和媒体一般无须特意分开且并不会对结果产生太大影响。不过在新闻门户等媒体平台,媒体更多的是指官方媒体和传统媒体。与微博等平台不同,在新闻门户等平台下的媒体,往往会更多地体现其生产者的角色,而非消费者角色。

文本挖掘分析是一个很宽泛的概念,其既具有宏观层面的分析功能,同时也兼具微观层面挖掘的能力。文本挖掘的基础在于分词、词性标注、句法分析、n-Grams模型、信息抽取及词语、句子、篇章等各种表示模型和方法,以及基于其各种表示的分析方法,如词云、词项网络、分类、聚类、自动文摘、机器翻译、情感分析、话题检测与追踪等。前文已经介绍了词云分析、词项网络、聚类等,本部分将介绍情感分析在舆情涨落研究中的应用。