5.4.4 内容分析
用户网络分析获取的是用户之间的关系,而内容分析获取的则是帖文中所蕴含的各种信息。本文内容分析涉及帖子数为424964,主题数为29941。内容分析方法细节和结果依具体的分析目的不同而不同。本文挑取了如下几个方面进行简要分析。
(1)从市县区谈及率看论坛特点
温州各县市区的谈及率,是指各个帖文中对它们的提及情况。谈及率如图 5-26所示。

图5-26 温州各县市区的谈及率(百分比)
从上图可见,三区的谈及率都极高,这主要是由地方性论坛影响力的本地化特性所决定的。泰顺、文成、洞头谈及率处于垫底的地位,这应该主要是由经济、人口、网络普及率、传统因素导致的习惯等因素导致的,当然同时也可能由于它们与温州的物理距离较远,故缺少对很多温州所发生事情的接触、了解,当然也就缺少了对很多现象的爆料、评判的兴趣。苍南人口众多,谈及率稍微偏高应属正常。但是,永嘉人口虽相对较少,但其谈及率却雄踞第二;瑞安、乐清、平阳人口较多,尤其是瑞安和乐清,人口居温州各县市区之首,但是其谈及率却与其人口比例严重不对称。结合前述各论坛的相关数据,我们可以推断:在多事之秋,人们总是希望在虚拟的社会中找到一个情感宣泄和意见表达之处,当本地无法找到合适的场所或条件时,他们就会将视野转移到一个心目中最为接近之处;当本地有适当的场所时,则较少地转移到其他地方,即论坛具有本地化这一客观决定因素。正是由于乐清、瑞安的本地化论坛运营良好,故虽然这两个为人口大市,但其网民多半被吸引在本地,少有在他处寻求释放和寄托的;平阳本地化论坛虽然发展势头不强,但仍或多或少留住了一些网民,故其谈及率也较低。永嘉与平阳虽然人口相当,但其谈及率却远高于瑞安、乐清和平阳,可见永嘉网民首选论坛对象并非本地的,他们更乐意选择邻近的温州。
当然,随着论坛的逐渐没落,也有可能当网民在论坛上的表达场所被干扰时,他们干脆彻底离开论坛这种媒体形态,而转移到其他媒体形态上,如微信等,或者以后出现的其他媒体形态。另外,由于人们一般还是倾向于将本地化事物诉诸于本地化媒体,本地化网民一般也更关注本地化事物,容易对与自己切身利益相关的本地的人和事产生共鸣。
(2)从政府部门谈及率看温州社会问题
社会化的版块谈论的都是社会化的事物,各类社会化事物都脱离不了相关政府部门的管理或参与,人们的言论、不满、褒扬相应的也会涉及这些部门。基于此,对政府部门谈及率的分析,可以让我们轻易地看出温州存在的主要热点问题。如图5-27是温州市政府部门谈及率的前十名。

图5-27 温州各政府部门的谈及率(百分比)
从图中可见,排在前六位的依次为公安局、城管、纪委、法院、教育局、环保局。可以说,这六个部门所管理的问题大多都关系到社会民生,在全国各地都是热门问题;后四位的发改委、工商局、国土资源局、财政局则差别不大。公安局由于与社会民生紧密相连,因此被排在首位。这意味着社会民生中的各种社会不公、违规违纪、偷盗等现象较多。
(3)从网络用语看社会环境及网民心理
语言是人们在网络上表达态度、意见的具体依托呈现形式。互联网的发展,使得语言的发展获得了空前的自由化,人们在这种环境下,创造了层出不穷的词语,并且一旦被呈现于世,很多都迅速火遍网络。不过正如俗语所说的:来得快也去得快。虽然很多曾经红极一时的词语已经销声匿迹,或者已极少被人使用,但是它们的出现却反映了当时社会的一些群体心态。
总的来说,网络流行语都从侧面映射了当前社会中普遍或特立独行且容易引发关注的一些人物、事件或现象。若从时间纵向演化角度来看,则可以看出社会群体思潮的整体变迁。
(4)从高频词网络看温州
正如上文所述,网络文本内容是网民情绪、意见、观点的表达,我们可以将网络文本视为其生产者的代言人。并且从某种意义上说,由于互联网上网民真实身份的隐蔽性,其表达约束更少、更自由,例如没有男女之分、没有上下级之分、没有老幼之分等。一个人谈论某个话题不能意味着什么,但是足够多的人谈论某个话题,则意味着该话题一定程度上体现着网民的意志或期望。从而能为社会治理和一些宏观决策提供辅助支撑。
如图5-28是针对论坛帖文分析所得到的词频网络。不过由于太过完整的网络存在着两个方面的不足,其一是节点数及节点之间的连接过于庞大,呈现和处理都存在着较大的问题;其二是其脉络难以理清,可理解性较差。故实际研究中,研究者都将根据具体的分析目的,在保留网络核心结构和主要信息不变的情况下,对原始词频网络图进行修剪。下图正是通过一定的阈值策略进行修剪过后的结果。
由于该网络的中心区域仍然较为复杂,对人眼而言,可理解性稍差,故下面将首先解释网络周围较为稀疏的区域,对于中心区域的讨论将在下文围绕着节点温州的EGO网络展开。

图5-28 高频词网络
不过由于上图中间网络连接较为复杂,为了便于看清温州的具体情况,故将节点温州的EGO网络(即直接邻域网络)提取出来,如图5-29所示。

图5-29 “温州”邻域高频词网络
从图中可见,与节点“温州”的一级邻域节点涉及三类:辖区名称、政府机关部门、热点领域词汇。
①辖区名称:瑞安、苍南、鹿城、平阳、瓯海、龙湾。这与上文温州各市县区的提及率情况一致。其他提及率稍低的市县则由于某些链接较弱,因而已被剔除。政府机关词汇为:政府、公安、环保局、法院。这些都是关系到社会和民生的部门,反应了网民对社会和民生的关注。
②政府机关词汇:政府、公安、环保局、法院。
③热点领域词汇:房、车、书记、企业、金融、鞋业、农民、征地、交通、腐败。
下面笔者将挑取一些比较典型的讨论如下(注:部分细节需要结合上图进行理解)。
①金融相关问题是热点。这主要是由当时的温州金融改革、企业相关联的金融问题、楼市相关联的金融问题等综合导致的。
②企业相关问题。如企业资金链断裂、企业信贷、企业跑路都是当时的相关热门话题。
③与房相关的问题突出。如在上图左侧,可以看出与房相关的字眼为“农民”“价”“炒房团”“退房团”等。通过几个字眼基本可以看出网民线上讨论的话题无非集中在房价问题、炒房问题、农房拆迁改造等问题上。
④温州与车相关的问题较为突出。相关问题有停车难问题,易吸引眼球的豪车相关问题、行车整治、行车安全、出租车涨价问题等。
其他核心节点的EGO网络不再一一分析。
⑤从内容分析用户身份
用户的分析,只需要针对其参与的帖文进行即可。下面以上述图5-25中的“前后左右良心”为例进行说明。通过提取该用户的所有帖文,然后使用内容分析法(即提取文本、词簇分析等),初步的分析结果如图5-30所示。

图5-30 用户身份识别分析
从图中易见,该用户的帖文核心都是围绕出租车相关内容而展开的,如出租车相关服务质量、相关政策等。经过对帖文的进一步分析,基本可以确认该用户为出租车司机。
上述方法可以分析任意帖文较多的用户,当然同样也可以用于对微信内容的分析。