第4章 数据整形及处理

第4章 数据整形及处理

在对R语言的数据操作有了一定了解后,本章进一步介绍数据整形及处理的常用包和函数。本章首先介绍整洁数据(Tidy Data)和数据整形(Data Wrangling)的内涵,让读者对tibble格式数据集特点有所了解;其次,介绍tidyr包的4个常用函数及其使用方法、dplyr包的6个常用函数及其使用方法,让读者掌握应用tidyr包实现数据整形的方法,包括数据拆分合并、长宽数据转换等,熟悉基于dplyr包的数据探索性分析,包括筛选、排序、选择、分组、汇总等;最后,通过一个综合案例讲解数据整形及处理的技巧。通过本章的学习,读者应该掌握以下几点。

·了解整洁数据的概念,以及tibble格式数据集与数据框的异同点。

·了解tidyr和dplyr包在数据整形中的不同作用。

·熟练掌握tidyr包的4个主要函数及其使用技巧。

·熟练掌握dplyr包中的6个核心函数及其使用技巧。