4.2.1 tidyr包

4.2.1 tidyr包

读入R环境下的数据集最好是整洁数据集,若不符合要求,则需要对数据进行清洗。在R中,整洁数据的定义为:每个变量的数据存储在自身的列中,每个观测值的数据存储在自身的行中。

tidyr包是tidyverse包集合的核心包之一,主要提供了一个类似于Excel中数据透视表(Pivot Table)的功能。tidyr包主要有4个函数:separate()、unite()、gather()、spread()。其中,separate()和unite()函数主要对变量进行拆分或合并;gather()和spread()函数主要做数据整形,将宽数据转成长数据,或将长数据转成宽数据。加载tidyr包有两种方式:

tidyverse包是一个汇总包,加载tidyverse包的同时会加载tidyr包。