二、类目建构
本次研究的主要目的是识别样本大V用户在微博上的表达失范行为,并分析其演变过程,总体框架如图7-2所示。在确定样本大V用户的列表并对其微博内容和用户信息进行爬取之后,采用基于机器学习的方法对存在失范现象的微博进行自动检测,并根据表达失范的类型进行分类。然后,按年度对分类结果进行分组,最后得出更具细粒度的总体失范演化和基于用户的演化结果。基于前文对表达失范内涵的探讨、类别划分以及表现方式的分析,本次研究主要从新浪大V的用户类型、新浪大V影响力的级别、表达失范类型、表达失范表述框架等方面进行类目建构和分析。
图7-2 微博表达失范演变的分析框架
(一)新浪大V的用户类型
新浪大V的认证类型往往是其身份的象征,身份代表着他们的利益诉求和心理观念。部分认证大V并非单个用户个体,他们的背后往往是组织形式的支持团队,代表组织的集体利益,其微博内容也会显示出组织的价值标准和利益关系。
本次研究根据新浪大V的认证类型,将用户分为名人用户、媒体用户、普通用户、政府用户、企业用户、网站用户、群组用户、校园用户共8种类型。名人用户指在专业领域中具有突出个性、特点或专业知识的用户,具有较高的知名度和影响力,如“@姚晨”“@李佳琦Austin”等。媒体用户代表媒体组织,指由结构分明的编辑团队进行运营的用户,依托稳定的信息源和权威性而具有较高的公信力,如“@人民网”“@央视网”等。普通用户指未经认证的一般用户。政府用户代表的是政府部门,以微博作为平台开展政务服务,发布相关政策消息等,如“@德州环境”“@南京发布”等。企业用户指以企业名称进行认证的用户,是企业的对外形象,通常用于宣传和培养粉丝,如“@小米公司”“@美的集团”等。网站用户以网站为主体,如“@花瓣网”等。群组用户代表某一具有共同特征或共同利益取向的群体进行认证发言,如“@巴萨中国球迷协会”“@武汉市小动物保护协会”等。校园用户代表某一学校,如“@北京大学”“@河北衡水中学”等。
依据认证主体的属性,可将上述8种认证类型再划分为个人认证类型、权威认证类型和组织认证类型三类。如表7-2所示,名人用户、普通用户属于个人认证类型;媒体用户、政府用户、网站用户属于权威认证类型;企业用户、群组用户、校园用户属于组织认证类型。
表7-2 认证类型的类别
(二)新浪大V的影响力
新浪大V话语权的影响力主要来源于粉丝数量,粉丝数量的多少决定了其内容的传播范围。因此,本次研究以粉丝数量作为衡量新浪大V影响力的标准。在语料库中,样本大V用户粉丝数量从0到1.8亿不等,根据粉丝数量将用户的影响力分为从1级到7级共七个级别,新浪大V的粉丝量逐渐增多,影响力也随之逐渐增强。
(三)表达失范的类型
本次研究首先将样本大V用户的微博内容分为规范微博和失范微博两类。如前所述,表达失范可细分为道德失范、纪律失范和法律失范三类。由于法律失范涉及法律问题,有强制力加以约束,故而此处主要研究道德失范和纪律失范,这两种类型在语料库中也比较常见。道德失范主要指违反社会道德的表达,纪律失范则指反对国家、宗教、种族等的不利言论,因此,后者的影响比前者更具负面效应。具体来说,含有粗俗词语的表达被视作道德失范,带有攻击国家、种族、宗教或违反法律的表达则被认为是纪律失范。
(四)表达失范的表述框架
表达失范的表述框架是指大V在微博内容中体现出的情感倾向,情感的表达会直接影响大V对粉丝的吸引力,同时也会对内容本身的扩散程度产生影响。新浪大V的情感倾向依托于不同的身份表征和影响力级别,往往会受这些因素的影响。根据大V的微博内容,可以将表达失范的表述框架分为积极的、消极的和中性的三类(见表7-3)。同时,这一表述框架也可以用来探讨微博内容的理性与非理性。
表7-3 表达失范的表述框架实例