4.1 整洁数据和数据整形

4.1 整洁数据和数据整形

从现实世界中采集而来的原始数据(Raw Data)含有大量噪声(如存在离群值、缺失值、日期格式不统一等),需要经过数据清洗(Data Cleaning),让数据结构化后才能用于分析。近年来,基于R语言的数据分析流程越来越强调将原始数据转为整洁数据。为此,本节将首先介绍整洁数据的概念;其次,讲解5种常见情形下整洁数据的处理(即数据整形);最后说明数据操纵的概念。