6.4 时间维度的演化涨落研究
时间维度的涨落分析是一种最基础最常见的涨落分析手段之一,其重点在于关注舆情信息量随着时间的变化情况与态势。其时间戳数据特征明显,抽取容易,分析过程简单易行。目前关于网络舆情时间维度相关的研究,并没有区分舆情信息的生产时间和消费时间。这种做法其实也没有什么太大的问题,这是因为无论是生产时间还是消费时间,都体现了网民的关注。
时间维度的研究重点在于网络舆情宏观上的涨落,而涨落的形成正是由于舆情生产者和消费者的关注。群体性的关注,总会有一部分会转化为持久性存储的网络舆情数据,具体而言,就是原生生产者、消费型生产者、中介型消费者、生产型消费者所发布的舆情数据。这类以持久性存储为目标形态的关注,我们称之为深度关注。这种关注向深度关注的转化率可以简单地借助于网络舆情的评论量和阅读量来粗略评估。
对于网络舆情,时间维度分析涉及到的时间主要是舆情信息的生产时间和消费时间。虽然研究者不对其进行细分一般也并无大碍,但是细分可获取更为精细的演化涨落趋势。基于这两类时间,不难知道存在着两类相应的时间维度涨落分析。
记时间为t,t时刻的网络舆情数据量为f(t),其中生产的网络舆情数据量为fp(t),消费的网络舆情数据量为fc(t),终端型消费者的消费量为
,网络舆情的分析时间跨度范围为T。由此3个数据量即可获知舆情在3个时间维度的演化曲线,并有如下关系:

其中,Rcp为同一时刻的消费量与生产量的比值,对应的曲线称之为RCP曲线,可用于衡量网络舆情的演化涨落阶段,曲线值越大,表明单位生产者所激发的消费者越多。如图6-3所示为某网络舆情的RCP曲线图。Rrw为关注转化率,它用来衡量舆情信息的接收者对信息的利用和转化为持久性数据的情况。
时间维度的涨落分析具有如下优点。
(1)分析所需要的数据获取简单。在已经拥有网络舆情数据的情况下,时间字符串数据具有明显的特征,可以比较简单地根据正则表达式从页面当中进行提取;在已经获取各个页面的时间戳数据的情况下,网络舆情信息量可以简单地通过计数来实现。
(2)分析过程简单易行。对于时间及与其相应的网络舆情数据量,通常的处理方式即将其呈现为t-f(t)曲线,即演化涨落曲线,如图6-3所示即为5项网络舆情的演化涨落曲线。

图6-3 某网络舆情RCP曲线
(3)结果简单直观。通过网络舆情演化涨落曲线,研究者可以直观地判断网络舆情的演化涨落情况以及接下去可能的演化态势。显然,时间粒度不一样,则其对演化细节的解析程度不同。时间粒度的每一次细化,即相当于使用放大倍数更大的放大镜来审视舆情的演化细节。如图 6-4所示即为“日”粒度上的演化情况。

图6-4 网络舆情演化涨落分析曲线
(4)分析灵活易控。可以根据需要以决定是否进行较为精细的时间维度涨落分析。通常情况下,我们只分析t-f(t)曲线。事实上,我们还可以分析t-fp(t)曲线、 t-fc(t)曲线;此外,我们也可以通过Rcp、Rrw来从其他侧面了解舆情。
(5)网络舆情演化涨落曲线还可以方便地分析并行网络舆情之间的关系。当网络舆情空间选定合适的时候,通过网络舆情演化涨落曲线,我们可以轻易地分辨出舆情之间是否存在相关关系,例如这些舆情之间是否存在“此消彼长”关系或“同生共死”的相干性或类相干性关系。“此消彼长型”网络舆情之间关系密切,其形成原因即网络用户兴趣转移。至于引起用户兴趣转移的原因,最为典型的有两种:外力干预(如管控或网络公关)和自然消退(即网络用户的自发兴趣转移)。而“同生共死型”舆情间同样关系密切,这种并发舆情往往由网络舆情的次生舆情导致。当次生舆情不及诱导舆情主体时,则两者呈现同生共死关系;若次生舆情超越诱导舆情主体时,则也可能呈现一定的此消彼长关系。