5.4.3 会员网络分析
(1)累积频次
累积频次Freqd:指分析对象在整个分析数据集中的出现频次,统计时要精确到论坛中的楼层级别。该指标可应用于对用户分析和内容分析中的关键词或概念分析。
当该指标用于分析用户网络时,分以下两种情况:
①当数据分析单元为帖子主题级别时,该量可以衡量用户对某个帖子主题的参与程度。
②当数据分析单元为全局数据集级别时,该量可以衡量用户对整个论坛或版块的参与程度。
当该指标用于分析词簇网络时,分以下两种情况:
①当数据分析单元为帖子主题级别时,该量可以评估帖子的中心议题情况。
②当数据分析单元为全局数据集级别时,该量可以衡量整个论坛或版块的话题情况。
(2)主题频次
主题频次Freqt:指分析对象在整个分析数据集中的出现频次,统计时应精确到论坛中的主题级别。所以该指标与累积频次不同,它仅用于全局数据集层面。
①当该指标用于分析用户网络时,该量可以衡量用户对整个论坛或版块的参与程度。
②当该指标用于分析词簇网络时,该量可以衡量整个论坛或版块的话题情况。
(3)激励值
由于对具体的分析对象而言(用户或词),在有些情况下,单纯依赖于累积频次或主题频次,研究者仍无法准确地辨识两个分析对象的相对参与程度,故基于上述两个指标,本节定义一个新指标,即激励值。
激励值![]()
在应用于用户网络分析时,显然,该值越大,表明对某个用户的关注的话题数越少,但参与具有深度或者持久性,该类用户往往有某种特殊目的或者某种特殊爱好。该值越小,往往表明某个用户关注话题越多且广,但参与深度有所欠缺或者无持久性。该指标可用于辅助分析某些帖子背后的推手(王子文等,2011)。
(4)簇类型
用户网络中的簇,是一种在用户网络中的强连接团伙。当然这种团伙并非一定是合作关系,也可能是对立关系导致的强连接。对论坛而言,识别这种簇,除了可以发现合作关系的团伙或互相对立对骂的团伙,还可以发现另外一种双簧现象——真身及马甲互相推波助澜,例如有的幕后推手会推动某些帖子取得更大的影响力并尽可能实现自己的最终目的。
本文采用三种基本的簇类型,分别为星形簇、链式簇(环式簇为链式簇的特例)、网络簇。其基本示意图如图5-20、图5-21、图5-22、图5-23所示。
①星形:星形用户簇的中心节点表示具有广泛参与度的活跃用户。从全局时间域来看,其协同合作者往往是变化着的,而从一个局部时间域来看,也可能是固定的。在实际的大型用户网络中,较少存在独立的星形簇,但对网络进行修剪后,星形簇是可能存在的。星形簇的中心节点往往具有领袖的地位。
②链式:在簇分析过程中,倘若频次无限制,则链式结构将是最为常见的用户簇结构。二元簇是一种特殊的链式结构。二元簇越多,意味着一个论坛越多元化。但是当将频次限定在高位之上时,二元簇则意味着一个极为固定的组合,他们可能是兴趣爱好高度一致,也有可能是一对针锋相对的用户,当然也有可能是“一人两号”,即我们通常所说的马甲。多元簇将构成结构洞,且处于链中间的节点往往属于交际较广、然而却不愿意或者不善于主动交际的用户。链式结构有三种特例:环式、环尾式、树形。
③网络:网络型的用户簇往往意味着一个强连接的团伙。例如组织性很强的水军往往具有这类结构,收到统一指令后,统一组织的人员往往会对目标账户群起而攻之。表现在用户簇上,即会构成一个错综复杂的网络。这是实际用户网络中最为常见的一种结构,马甲账户较多、集体利益一致者很容易形成这种簇。但需要研究者注意的是:对同一个网络,修剪的方式不同,将得到不同的新网络。

图5-20 星形簇

图5-21 链式簇

图5-22 环式簇

图5-23 网络簇
(5)用户网络分析
本次用户簇分析共涉及36081个账户。用户之间的关系错综复杂,各种角色层出不穷。图5-24是对用户关系网络的部分分析结果(为了可视化效果不至于太混乱,笔者在此处隐去了各个节点的账户名称)。

图5-24 部分用户网络图
图5-25是从一个精简后的网络中分离出的几个典型簇。在图5-25中,右下角两个是典型的二元簇,而左下角的则为典型的三元簇(亦即链式簇),右上角则为四元簇(亦即简单的网络簇),左上角则为多元簇(亦即网络簇),是最为常见的一种簇类型,不过根据节点之间的权值我们可以清晰地看出,该簇可以被认为是由一个星形簇和一个网络簇通过三条弱连接构造起来的。
通过对用户网络中的簇探索及分析,我们可以轻易地获取用户之间的团伙关系。在论坛中,用户之间的强连接构成的簇,往往意味着一个团伙。
在下图右下角,“忠言逆耳”和”op852op”构成了二元簇。但他们却并非是合作关系,而是一种典型的针尖对麦芒关系。与“忠言逆耳”和“op852op”之间的针锋相对的关系不同,“枪郎”和“ 爱护楠溪江” 之间的关系则和谐得多,是一种互为促进的关系。

图5-25 精简后的用户网络中的几个簇
上图左下角中,“前后左右良心”“鹿城之子”和“djc863”是三元簇,构成链式簇结构。不过这种链式结构是假象,因为上述主干簇是从更为庞大的复杂网络中通过较高的阈值精简而来的部分核心骨架,本质上它们构成的还是环形结构。环形簇结构表明三个节点之前是两两连接的,但精简后成为链式簇结构,则意味着虽然三个节点之间相互关联,然而关联强度是有着较大差异的。而事实上也是如此,在论坛中,“前后左右良心”“鹿城之子”和“djc863”都长期关注着相同主题的帖子。只是相对而言,这种三元簇的环式结构是不对称的。
在上图右上角的四元簇中,几个账户构成了一个简单的网络簇。不过该簇与上述几个簇有两个典型的不同之处。其一,从四个昵称上看,都带有明显的“女性”色彩,如“女”“诗心”“香”“佳人”。其二,此四个用户共同参与的帖子非常多,这是极为罕见的,而上文几个簇中的用户则仅在少数的帖子中共现。据此可以推断,该四元簇中的四个用户极有可能是同一个社会实体对应的四个马甲账户,自身利用马甲来推动某些主题向其所期望的方向发展。
在上图左上角,是一个相对稍微复杂的网络簇。该簇中,以“桥头老老”为界,可以分为上下两个子簇,其中下部分是由“桥头老老”“乡下人5589”“chensanpao” “安全和谐”构成的星形簇,而上部分则为网络簇。下部分的星形簇中,所有用户关注的都是与“违拆”“拆迁”相关的主题,其中“桥头老老”还少量关注和参与了“六城联创”及“高新区”的一些问题。而这些恰好正是上部分网络簇中“kko317”“zhenhaoa”“cc703804”“sancity”等用户共同推进的帖子主题。
从上述对精简的几个簇的分析结果中我们可以看出,基于网络簇的分析方式,对于发现论坛中某些帖子背后的推手、识别论坛中的虚拟团伙、识别论坛中的马甲等,都是极为有效的一种手段。不仅如此,该方法同样可应用于其他更多的与此类似的复杂网络连接关系。