6.5 用户维度的演化涨落研究

6.5 用户维度的演化涨落研究

在各类网络平台中,用户和媒体是两个既存在关联又存在区别的概念。不过无论是用户还是媒体,他们要么是舆情信息的消费者,要么是舆情信息的生产者,当然也有可能兼具两种角色。

用户维度的演化涨落研究,即根据舆情信息流的方向(例如转发、评论、提及等都对应着舆情信息流)来确定用户之间的连接关系和连接强度,进而形成带权的网络拓扑图。例如图6-5所示即为某个网络舆情所涉及用户的网络拓扑图(未考虑权值)(谷琼等,2020)。这在社交网络研究中,已经成为一个常规主题,此处不再展开。

图6-5 用户网络拓扑图

但对用户网络的涨落分析还需要厘清两个基础性问题:哪些是用户及用户的同一性问题。

广义地说,任何使用网络的实体(常为具体且较为固定的人)都可以被称为相应平台的用户。但若从较为具体的层面来看,则有如下几个问题需要厘清。

(1)注册用户和匿名用户。对于各类平台,包括新闻门户、论坛、微博等,虽然存在着海量的注册用户,不过同时也存在着大量的匿名用户。从技术角度来讲,这两类用户的分析手段会有所区别。对于注册用户,由于有明确的区分手段,因此其各类数据的获取和分析相对容易很多,尤其对平台营运方更是如此;对于匿名用户,则缺乏可信的手段去确认。对于个人电脑,在Cookie开启且允许持久化存储的情况下,对匿名用户还是有一定的区分能力的,但是在公用电脑(如网吧、图书馆等公共场所)或存在安全防护措施干扰的情况下(如用户使用了浏览器的痕迹清除功能,或者使用了安全软件或者各类相关清理工具),则很难跟踪到用户。对平台运营方而言,公用电脑的多个匿名用户,将会被视为是同一个用户。因此,从这个角度来看,通常的各类较细粒度下的分析中,其实更多的是指向注册用户。只有在部分面上分析的场合,才会考虑匿名用户,例如平台用户访问量分析统计等场合。

(2)机构用户和个人用户。所谓个人用户,即虚拟账号对应某一个物理空间个体的账号;所谓机构用户,即一个虚拟账号对应多个隶属于同一个机构(此处机构并不一定是现实物理世界中存在的真实实体机构)里的用户的账号。严格地说,一般很难区分真正的个人用户。因此一般意义上的个人用户和机构用户,更多地从账号名称及其介绍角度来进行区分的。正因为如此,一般地,个人用户和现实物理空间中的实体人其实并不是严格的一对一关系,即一个虚拟账号对应各位实体人的情况是大量存在的。不过,整体而言,个人用户还是相对简单一些,即网络虚拟世界中的个人用户绝大多数唯一的对应现实物理世界中一个物理实体人。机构用户则由群体控制或使用,即一个账号对应多个在现实世界中拥有某种共同利益、目标或追求的物理实体人。例如一个政府机关、一个虚拟社区、一个社团组织、一个班级、一个公司、一个兴趣共同体等都是机构用户。但这并不意味着机构用户必定直接的被多个物理实体人操作,在一个庞大的机构中,也有可能真正直接操作机构账号的就只有一位实体人。

(3)网络虚拟世界中的用户和现实物理世界中的人。这两者关系紧密,其间存在着复杂的映射关系。一个物理空间中的实体人,可能会对应着网络虚拟世界中的多个用户;反过来,一个网络虚拟空间中的用户,也有可能对应现实物理空间中的多个实体人。例如,同一个实体人,很有可能在微博和微信平台中使用不同的账户。

厘清了如上问题,用户维度的第一个问题也就出来了。即如何鉴别虚拟用户和现实物理人的对应关系,更具体地,即如何能鉴别出多个虚拟账号的同一性,亦即多个虚拟账号背后直接操控者的同一性。

这一以前不可能解决的问题,在大数据及其相关技术的支撑下,成为可能。当然,若拥有超越各个平台的能力,且在网络实名制的有力支持下,这一问题就轻松得多。不过这个并不能解决机构用户所带来的问题。况且,这种跨越平台的用户数据获取和把控能力,其获取并不容易。

基于大数据及相关技术,构建统一的用户模型(例如可以考虑利用网络用户的登录时间、地点、发布内容、发布时间、生产或消费时间等来构建),结合内容的挖掘分析,则是可能实现基于第三方的网络用户同一性识别的。

至于具体的研究方法,主要是基于复杂网络(社交网络)理论和技术来完成的,如王旭等(2017)采用社交网络分析研究了“魏则西事件”,王晰巍等(2015)采用社交网络分析了“雾霾”话题,石彭辉(2013)采用社交网络分析方法分析了“人社部拟延迟退休事件”。康伟(2012)则基于用户网络研究了其中关键节点的识别。其他的具体方法如小世界网络(刘常昱,2006)等。由于这些方法都是较为成熟的经典方法,此处不再赘述。