16.3 本章小结

16.3 本章小结

本章先后介绍了针对开放性新闻文本和美国总统就职演说文本的数据分析流程:首先是案例背景介绍和数据集介绍;其次是数据的读取、预处理部分,其中数据预处理环节主要使用dplyr和stringr包结合正则表达式;最后是数据分析部分,我们依次说明了文本型数据分析的几个重要方法,如文本聚类、TF-IDF、主题模型等。读者可以依据自己的研究需要,选择合适的工具来获取文本分析的结果。