从本章开始,数据分析的视角将从数值数据转向文本数据。本章将为不熟悉文本数据分析的读者做导入介绍,首先,简要介绍文本分析的概念和重要性以及与数值数据的异同点;其次,介绍文本分析的基本流程;最后介绍文本预处理、文本特征提取以及不同粒度文本分析的常用方法。通过本章的学习,读者应该掌握以下几点。
·文本数据与数值数据的异同点。
·文本分析的基本流程。
·中英文文本数据预处理的常用方法。
·文本特征提取的常用方法。
·不同粒度文本分析的常用方法和工具。