16.2.2 案例二数据读取
使用quanteda包进行文本分析时,常用readtext包进行数据读取。readtext()函数可以读取不同的文本形式,同时返回能够直接用于语料库构建的变量类型。
readtext()函数适用于以下几种格式的文件。
·txt格式文件,即纯文本格式的数据文件。
·csv格式文件,即逗号分隔开的数据文件。
·xml格式文件,即采用xml格式的非结构化数据文件。
·Facebook API json格式文件,即从Facebook API获取的json格式数据文件。
·Twitter API json格式文件,即从Twitter API获取的json格式数据文件。
·通用json格式文件,即无特定要求的通用json格式数据文件。