1.4.6 舆情空间
无论是在现实社会中,还是在互联网上,每天都有大量的舆情信息。传统的舆情研究方式,更多的是以案例的方式进行,即以某个舆情为研究对象,对其进行多方位的深入研究。
随着近些年深度学习和大数据技术的迅猛发展,研究者具备了从更多角度、更深层次研究多个舆情的能力。借鉴数学中的向量空间的概念和含义,我们将由研究的多个舆情及其要素所组成的研究范围称为舆情空间,我们也可以简单的将其理解为舆情的集合。
为了方便下面的论述并使表述系统化,我们用符号标记各概念,具体如下。
(1)事件:O
事件可以被视为事件要素的集合,用O表示,要素具体包括事件发生时间段ot、事件发生地点os、事件相关人物(主要是当事人)op、事件描述od等。因此可以将事件表示为![]()
在无须具体化各个要素的情况下,可以用oi笼统的进行表达,即
n=Card(O)表示事件数量,注意此处∑不代表求和的意思,它用于表示各个要素的共同作用。
(2)环境:E
环境包含了时间、空间、心理要素及周边或当时的各种自然和社会要素,用E表示。其中的空间一般不应被隔离来看,而是要结合周边自然和人文社会等情况,将空间及周边要素作为一个整体记为es;同样,时间也不应被隔离来看,也需要结合当时的时代背景,将时间及相关的时代背景记为et;此外,微观的心理环境虽然极大的受到宏观时空环境的影响,然而微观环境毕竟还存在一定的私密性和独立性,因此将其作为环境的第三大要素,记为ep。更进一步,时间、空间、心理微环境也应该作为一个整体来考虑,此即环境E,因此我们记E={es,et,ep}。
(3)生产者:P
虽然在前文将生产型消费者放在消费者部分介绍,但是在构建舆情空间时,一般都将其归结为生产者之列。因此,生产者就有两类,分别为原生生产者pf和消费型生产者ps。由于在很多情况下不需要区分其类型,因此也可以记为P={p1,p2……pn},n=Card(P)表示生产者数量。
对于两项舆情,可以定义其叠合生产者比 
一般地,该值都较小,根本没有接近其上限值1的可能。显然,叠合比越大,表明两项舆情的共性激励要素越多,在并发舆情涨落关联分析时,其应被赋予更高的关注度。通俗地讲,这意味着并发舆情可能主要由同一群体在背后策划推动。不过,叠合比越小,虽然在直观上其间的关系越弱,但是实际上并不意味着其间真的呈现如表现出的那样的弱关系。因为这种弱关系有可能是有意为之,主要用于转移受众注意力。此时可以结合事件O的发生时间ot、事件描述od等进行进一步的分析。当并发舆情间存在极强的主题相关性时,且在相近的环境E和相同的媒介M下,接近下限的叠合生产者可能存在极大的人为干扰要素。

(4)消费者:C
消费者可细分为3类,分别记为终端型消费者ct、中介型消费者cm和生产型消费者cp。在不区分消费者类型时,可以将其记为C={c1,c2……cn},n=Card(C)表示生产者数量。
与生产者类似,也可以定义其消费者比 
(5)信息:I
舆情信息可表达为未经处理的相关文档集合。之所以强调未经处理,因为我们可以对最原始的文档做挖掘提炼,所得到的依然是舆情相关的信息。记舆情信息为I={doc1,doc2……docn},n表示舆情相关文档数量。
舆情信息是对舆情事件进行描述的过程中产生的。在描述过程中,每个不同的描述,都会成为舆情事件一个不同的映射版本。借由不同版本而产生的舆情信息博弈,也常成为舆情发展演化涨落的原始驱动力。
设事件
并设事件记录作用为f,则oi'=f(oi),因此记录的事件为
显然,O'与O虽然存在着极为密切的关系,但其间并不存在着特定的关系,而是存在着多种可能的关系。O'与O可能的关系及相应的解释如表 1-1所示。
表1-1 O'与O的关系及其解释

注:∅表示空。
由于上述关系5为现实中的常态,因此下面对其几种典型情况稍做深入讨论。
①当Card(U)≪min(Card(O),Card(O'))时(其中,Card()表示求取集合中元素数),记述和事实相隔甚远。对这类情况,需要消费者具备足够的分辨能力,否则极易被错误信息引导。这也是现实中需要重点防范的问题。
②当Card(U)≈Card(O)≪Card(O')时,基本包含了全部的事实记录,并有大量的延拓性信息。在现实中,这往往对应着一些负责任的深度报道。
③当Card(U)≈Card(O')≪Card(O)时,仅包含了部分事实记录,并无扩展性内容。在现实中,这往往对应着一些快讯。
(6)载体:V
载体即舆情数据的容器。一项舆情所涉及的载体往往不止一种,也不是简单地按照先后次序出现的,他们是错综复杂交织在一起的。不过,一般在确定具体的研究领域后,其载体往往就比较单一。例如当确定研究某个网络舆情时,关注的往往就是网络载体。可以将载体记为V={v1,v2……vn},n表示涉及的载体数量。
(7)媒介:M
由于媒介与载体有很强的相关性,因此在一项舆情研究中,往往也会涉及多种媒介。我们将媒介记为M={m1,m2……mn},n表示涉及的媒介数量。
(8)单项舆情的标记 s
舆情可以表达为各个舆情要素的函数,即s=f(O,E,P,C,I,V,M)。
(9)舆情空间的标记S
由于舆情空间为舆情个体的集合,因此记舆情空间
,其中∑不代表求和,也不代表线性组合,仅用于表示多项舆情的叠加作用。
根据研究的需要,我们来构建相应的舆情空间。舆情空间的大小,应该根据自己的需要创建,并不一定必须得包含所有舆情,也不一定只包含当前舆情。当然,若各类软硬件条件富余,将所有舆情纳入舆情空间也是没有问题的。构建合适的舆情空间,利用其中的要素,可以实现对舆情的定量化研究。
例如,为了计算舆情间的关系,如何表达舆情就成为关键。可以利用单项舆情的各类要素,构建其向量化表达,基于此可以利用各类数学化的手段实现舆情及其间关系的定量计算。再例如,利用不同舆情间消费者、生产者的叠合情况及舆情信息量随时间的演化曲线等,可以研究同一舆情空间中若干舆情之间的相互涨落关系。