4.6 本章小结

4.6 本章小结

本章首先介绍了整洁数据和tibble数据格式的特征。其次,讲解如何使用tidyr包和dplyr包进行数据整形和探索性分析,为此,我们需要重点掌握separate()和unite()函数对数据的拆分与合并,gather()和spread()函数对数据的长宽转换。最后,介绍dplyr包的6个核心函数的使用场景与基本功能:filter()函数用于行筛选,返回满足条件的观测值;arrange()函数用于观测值排序;select()函数可用于列筛选,但只保留选择的变量,还可与其他函数配合使用;mutate()函数用于列操作,可以新增一个变量字段,也可以对已有变量运算衍生一个新变量字段;group_by()函数用于数据分组以及分组之后的dplyr操作;summarise()函数用于汇总数据,相当于Excel中的数据透视表功能。