8.4.1 英文文本的情感分析
2025年09月26日
8.4.1 英文文本的情感分析
tidytext包中包含三个常用的英文情感词典,分别为afinn词典、bing词典和nrc词典。我们可以通过get_sentiments()函数来获取这些词典。
首先加载需要的包,示例如下:
然后使用get_sentiments()函数获取tidytext包内置的三个情感词典,示例如下:
接下来,以janeaustenr包中的小说文本为例,对英文文本的情感分析进行说明。janeaustenr包中包含简·奥斯汀(Jane Austin)的6本完成出版的小说的整洁数据,该数据集有两个字段,分别是小说文本(text)和书名(book)。我们可以通过austen_books()函数获取数据内容,然后通过unnest_tokens()函数将文本转换为整洁格式,示例如下:
下面通过bing词典查看《Pride&Prejudice》一书中出现频次最多的积极词,示例如下:
我们也可以尝试使用afinn词典计算情感得分,从而查看每部小说在叙述过程中的情感变化,示例如下(结果如图8-10所示):
图8-10 情感分析可视化