16.2.2 案例二数据读取

16.2.2 案例二数据读取

使用quanteda包进行文本分析时,常用readtext包进行数据读取。readtext()函数可以读取不同的文本形式,同时返回能够直接用于语料库构建的变量类型。

readtext()函数适用于以下几种格式的文件。

·txt格式文件,即纯文本格式的数据文件。

·csv格式文件,即逗号分隔开的数据文件。

·xml格式文件,即采用xml格式的非结构化数据文件。

·Facebook API json格式文件,即从Facebook API获取的json格式数据文件。

·Twitter API json格式文件,即从Twitter API获取的json格式数据文件。

·通用json格式文件,即无特定要求的通用json格式数据文件。