5.2.2 文本共现分析一般性思路
2025年10月24日
5.2.2 文本共现分析一般性思路
在图书情报领域,引文、作者、关键词等的共现分析相对比较简单。此外其实还存在一种较前述分析稍微复杂的基于文本的共现挖掘方法。其分析操作的核心思想和流程如图5-2所示。

图5-2 文本的共现分析挖掘一般性流程
下面笔者将针对其各个步骤作简要阐述。
(1)明确分析任务。该步骤不仅决定了应该采集哪些数据,也决定了后续高频词、关键词或主题词的选择问题。
(2)收集待分析的文本数据集。明确分析任务后,该步骤一般应选用主题采集策略进行。
(3)对前述文本数据集中各文本进行分词。
(4)统计各个文本及整个数据集中的高频词。不过,研究者也可能根据具体的分析需求,定义特定主题的关键词,而不一定必须为高频词。
(5)统计高频词(或特定主题词)的共现数据。为了使后文可视化取得更好的效果,该步骤可能会涉及部分词项的归并问题。
(6)结合其他数据知识或特征进行深层挖掘分析。分析目的不同,该步骤可能会有极大的不同,此处不再展开。