4.1.3 舆情热点的追踪
2025年10月24日
4.1.3 舆情热点的追踪
在网络舆情热点的追踪场合,其宏观流程与图 4-1比较类似,但在细节上会有所不同,主要体现在以下几个方面:
(1)网络数据采集。与舆情热点的发现应用场合不同,在热点追踪场合,由于已经有了热点数据,因此需要采集的主题也是明确的,此时的网络数据采集是有确定主题的,因此主要采用主题采集方式。
(2)数据预处理。该环节与前述场合基本相同。但在链接提取场合,其要求是不一样的。由于此时确定了采集主题,因此对链接的有效过滤就成了高效采集的必备条件。过于宽泛的采集,不仅会浪费采集资源,还会浪费后续环节分析计算的资源。不过,过于严格的采集,也会导致部分数据的遗漏。因此在实际过程中,需要根据具体的资源情况进行取舍和平衡。
(3)文本提取。该环节与前述场合基本相同。不过,对所提出的文本最好进行主题核验,避免非当前舆情热点的相关信息混杂进来而影响后续分析。
(4)文本向量化。该环节与前述场合相同。
(5)聚类分析。若没有更为精细的聚类分析需求,该步骤在舆情热点追踪场合是不需要的。
(6)热点舆情。若没有更为细致的要求,该步骤在舆情热点追踪场合是不需要的。