6.5.2 共词分析

6.5.2 共词分析

共词分析是对文本数据中的词语或短语共现情况进行分析,进而提示它们之间关联强度的一种文本定量分析方法。该方法的前提假设是:两对共现词语在文本中出现频次越多,其内在语义关系越紧密。因此,通过统计共现词语出现的频率,可以形成一个词语共现网络,网络内节点之间的远近便可反映主题内容的亲疏关系。例如,通过统计文献集中关键词的共现情况,可以探索这些词语所代表的学科领域热点。

在R中,可以使用quanteda.textstats包进行共词分析,具体可以参考第7.5节。