6.5.5 相似性分析

6.5.5 相似性分析

相似性分析在文本分析中有着重要作用,例如,我们可以通过相似性分析探索不同文本之间的相似性,也可以基于文本相似性对文本进行分类等。对文本进行相似性分析,需要先将文本内容转换为向量空间模型,然后把文本内容相似性度量简化为向量空间中的向量运算,并且以空间上的相似度表征语义上的相似度。

在R中,text2vec、quanteda等程序包可以完成文本相似性分析的任务,具体可以参考第8.2节。