我国教育网络舆情热点话题的定义和研究方法

(一)我国教育网络舆情热点话题的定义和研究方法

在当今互联网信息爆炸的时代,任何人的想法和信念都可能被大众感知,从而产生新的话题并吸引公众注意力。随着讨论声量的提高,热点话题便从众多话题中脱颖而出。由于讨论度高的话题会被网友转发、媒体报道、各平台推送,因此单一话题会像滚雪球般吸引更多人的注意。一方面,从侧面反映了公众现阶段关注的话题;另一方面,公众所反映的民意对社会发展有重大研究和参考价值。

1.教育网络舆情热点话题的定义

在分析教育网络舆情的热点话题演变之前,需厘清热点话题与热门话题的区别。热点话题,即最近我们身边发生的热门新闻话题。公众习惯将发生的具有重大影响力或超强娱乐性的话题称为热点话题,该类话题往往具有鲜明的话题度与国民度、强烈的娱乐性和炒作性。热门话题,指的是一定时间、一定范围内,公众最为关心的热门问题,这些热门话题通过互联网而引起一段时间内公众强烈关注和政府实际干预[2]

2.教育网络舆情热点话题的研究方法

本研究采用的是主题分析方法,即在标引文献或文本前明确其中心主题的过程,包括提炼主题概念、剖析主题结构、确定主题类型及明确主题的内容等。主题分析是从相关新闻报道、话题概述、文件总结等数据资料中获取某个时期内人们所关心的主要话题和话题内容,以便更好地发现某些问题对当今社会的影响。笔者整合历年各重大话题的舆情发展概述文本,按以下步骤进行分析:

(1)根据文本的分布状况,使用LDA主题模型分别对历年文本进行话题抽取,每年提取4个话题,每个话题选定5个特征词。根据特征词与话题关联度信息,由于前5个特征词差异度较低,为使结果更为准确,改为每个话题抽取20个特征词。图3-2-1为“翟天临学术不端”事件主题模型抽取示例图,图3-2-2为其对应的词云图。

(2)为提高数据准确率,优先提取单个话题文本6—10个特征词,并使用jiebaR中文分词工具对历年话题文本做初步分词。由于热点舆情话题主要以文字形式呈现,因此在预处理时去掉停用词、副词、长度为1的词、出现频率为1的词、标点符号等,从中二次提取历年样本特征词(表3-2-1)。

图3-2-1 “翟天临学术不端”事件主题模型抽取示例图

图3-2-2 “翟天临学术不端”事件主题模型对应的词云图

表3-2-1 热点话题特征词提取示例

(3)以年为时间颗粒度,提取该年度话题关键词,以单个话题的单个特征词为分子,计算特征词出现的频次,以该年度话题特征词提取总量为分母,得出该年度话题权重分布情况(精确到小数点后2位)和特征词权重分布情况(精确到小数点后3位)。