8.4 文本情感分析
文本情感分析能够识别和提取一段文本材料中的主观信息,其主要目的是获取内容创作者对所讨论问题的态度。文本情感分析主要有两种方式:一种是机器学习;另一种是文本分析。本节主要针对文本分析方法进行介绍。这一方法的主要思路是:先把一段文本材料看作词语的组合,得出每个词语的情感得分,然后进一步把所有词语的情感得分的总和看作整个文本材料的情感得分。
使用文本分析方法进行情感分析时,需要依照分析的场景事先准备一个情感词典,对每个词语进行情感得分的赋值。R语言中有很多字典可以用来评估文本中的情感,对于一般的问题,可以直接使用这些情感词典;但对于一些具体的问题,则需要对情感词典进行修改或者依据分析场景自行构建情感词典。接下来,分别以英文文本和中文文本为例进行文本情感分析。