二、交叉分析
(一)大V认证类型影响表述框架
如图7-10所示,不同认证类型的用户在网络表达中的情感倾向有所区别。在个人认证用户发布的微博中,中性微博所占的比例最少,且消极性微博所占比例明显超出积极性微博;在权威认证用户发布的微博中,中性微博所占比例最高,具有主观倾向性的微博的比例明显低于其他用户;在组织认证用户发布的微博中,消极性微博的数量略高于权威认证用户,但仍低于个人认证用户。这说明无论是名人大V还是普通用户,在微博内容表达中更倾向于表明自己的主观情绪或看法,媒体用户、政府用户、网站用户则会选择更为客观、理性的分析,组织身份和权威地位在其中成为重要的影响力因子。
图7-10 不同认证类型的用户所表达的情感倾向
(注:个人认证包括名人用户、普通用户;权威认证包括媒体用户、政府用户、网站用户;组织认证包括企业用户、群组用户、校园用户)
(二)大V影响力影响表述框架
对以上用户微博内容的情感倾向进行深入分析,其结果如图7-11所示,不同影响力级别用户的情感倾向有较为明显的差异。从级别1到级别7,随着用户影响力的增加,积极微博和消极微博的比例同时下降,中性微博的比例逐步上升。由此可以看出,大V用户的影响力越大,主观倾向性微博的比例就越低,中性微博的比例升高。这说明影响力较低的用户在匿名性的互联网中较少受身份的限制,通常会态度鲜明地直接表达自己的观点;影响力较大的大V用户顾及庞大的粉丝规模和影响力,在表达观点时往往是客观的、谨慎的,通常会避免个人主观情绪影响舆论。
图7-11 不同影响力级别的用户的情感倾向
(三)大V用户表达失范的演变分析
1.大V用户表达失范的分布
图7-12显示的是失范微博在所有样本大V用户微博中所占的比例,横轴代表200位用户,纵轴代表失范的比例。
图7-12 失范性微博的比例
从图7-12中可以看出,13%的用户失范率高于0.5,只有5%左右的用户低于0.1,这说明微博表达失范现象是普遍存在的。同时,大多数用户的道德失范比例明显高于纪律失范。因此,应有区别地分配纠正失范表达的资源,道德失范需要更紧迫和更全面的整改措施。
此外,大多数用户的纪律失范比例低于0.1,这意味着大多数大V用户都有一定的纪律意识。他们了解纪律失范对自身声誉、粉丝甚至网络环境的负面影响,因此,他们谨慎遵守纪律规范,目的是避免纪律失范表达。
综上所述,由于大V用户的巨大影响力和吸引力,失范性微博表达可能会直接影响大量其他用户的表达,甚至导致大规模的社会表达失范。因此,需要采取更加有力和有效的措施来减少或消除大V微博表达失范现象。
图7-13显示了83名用户的微博表达异常分析结果,横轴为83名用户,纵轴为失范比例。从失范演变方面来看,2013年的失范比例可分为三个明显极化的阶段:0、0.2—0.8 和1。2014—2016年的失范趋势相似,比例分布在0—0.7。在道德失范方面,2013—2016年的比例波动越来越小,且比例不断上升,逐渐接近甚至与失范曲线一致。在纪律失范方面,比例和比例波动都在不断变小,2016年几乎趋于零。综上所述,失范比例总体基本保持稳定,随着时间的推移,道德失范的比例逐渐增加,纪律失范的比例逐渐减少。
图7-13 表达失范的演变
2.表达失范对影响力的影响分析
为了确定表达失范对新浪大V用户影响力的冲击程度,本节对失范率与用户粉丝人数的相关性进行了分析。表7-9显示了总体相关性分析的结果,表7-10为2013—2016年基于失范情况和粉丝人数的相关性分析结果。从两个表格的结果来看,微博表达失范对用户影响力的影响是相似的。
表7-9 失范率与用户关注者的相关分析
表7-10 失范率与用户关注者的相关分析
第一,失范和道德失范之间的相关系数高于纪律失范。这表明道德失范在失范表达中更为常见,且该现象是持续的。第二,纪律失范与道德失范存在显著的正相关关系,说明用户的失范表达往往是多样的。第三,失范率与粉丝数量呈负相关,这意味着失范表达会导致粉丝流失,从而降低大V用户的影响力。第四,纪律失范与粉丝数量显著相关,而道德失范的相关系数无统计学意义。由此可见,粉丝对纪律失范现象更为敏感。换句话说,表达失范特别是纪律失范会显著降低大V用户的影响力。
3.大V用户性别对表达失范演变的影响
不同性别的大V用户表达失范的演变情况如图7-14所示,横轴表示2013—2016年,纵轴为失范比例。从图中可以看出,不同性别之间存在明显差异。具体来说,男性大V用户的失范比例范围要比女性用户大得多,且男性大V用户拥有比女性大V用户更高的中值,这表明男性大V用户比女性大V用户更容易失范。从图7-14(a)可以看出,2013年以后,男性用户的失范比例呈下降趋势,女性用户的比例则呈波动上升的趋势。图7-14(b)显示了不同性别大V在纪律失范方面的表现,从图中可以看出,男性与女性的纪律失范表达都呈现逐年减少的趋势。图7-14(c)显示了道德失范方面的分析结果,从图中可知,男性失范比例呈下降性波动,女性失范比例则逐渐上升。综上所述,男性用户的失范现象较女性更为明显,但女性用户失范表达的上升趋势也值得关注。
图7-14 不同性别用户的表达失范现象分析
4.大V用户所处地区对表达失范演变的影响
不同地区用户的表达失范分析结果如图7-15所示,横轴代表语料库中样本大V用户的所在地区,纵轴代表失范率。图7-15(a)显示了失范比例的地区差异,2014—2016年不同地区的失范状况相似,而2013年的失范分布有较大差异,这可能是因为2013年时微博在一些地区的覆盖范围和用户数量较少,各种网络相关规范尚未出台。图7-15(b)显示了大V用户纪律失范表现的地区差异,比例为0—0.8不等,其中台湾用户的比例最高。图7-15(c)显示了大V用户道德失范问题的地区差异,除了2013年的安徽用户,其他比例均处于0—0.4。同时,2014—2016年,台湾用户比例最高,这可能与意识形态和语言规范方面存在明显的差异有关。因此,地方政府或相关职能部门不能简单地模仿或推广个别地区对表现失范的处理措施,应根据各地区的自身动态特征合理地分配资源并实施计划。
图7-15 不同地区用户失范分析
【注释】
[1]Yiming Yang,Jan O.Pedersen,“A Comparative Study on Feature Selection in Text Categorization,”Advances in Information Sciences and Service Sciences,1997,4(3),pp.412-420.
[2]G.Salton,M.J.Mc Gill,Introduction to Modern Information Retrieval,New York:Mc Graw-Hill,1983.
[3]C.Cortes,V.Vapnik,“Support-Vector Networks,”Machine Learning,1995,20(3),pp.273-297.
[4]T.Joachims,“Text Categorization with Support Vector Machines:Learning with Many Relevant Features,”Proceedings of the 10th European Conference on Machine Learning,1998,Chemnitz,pp.137 142.
[5]G.Siolas,F.D’Alché-Buc,“Support Vector Machines Based on a Semantic Kernel for Text Categorization,”Proceedings of the International Joint Conference on Neural Networks,2000,Como,pp.205-209.