数据的预处理是数据分析必不可少的环节,文本数据的预处理主要面向字符串进行处理,如剔除乱码或非正常显示的字符,剔除空格、换行符等。本节主要介绍R语言中处理字符串的两个重要工具:stringr包和正则表达式。