9.1 数据可视化的内涵

9.1 数据可视化的内涵

通常情况下,数据可视化是指将数据分析结果以图形的形式呈现。数据可视化旨在使数据容易对比,并能够用它来讲故事,以此来帮助用户做出决策。数据可视化可以表达不同类型和规模的数据,可以是只有几个数据点的数据集,也可以是含有大量变量的数据集。数据可视化的特点如图9-1所示。

图9-1 数据可视化的特点

R语言拥有数量众多的可视化包,数据可视化是R语言进行数据分析最强大的功能之一。一图胜千言,数据可视化图表可直观传达信息的关键方面与特征,从而实现对于相当稀疏而又复杂的数据集的深入洞察。

传统的图表大多以静态、单向的信息呈现为主,随着技术的发展,图表向动态、双向、响应式(Reactive)呈现演进。R语言中的可视化包很多,主要包括:lattice、ggplot2、plotly、r Charts、recharts、google Vis、htmlwidgets、word Cloud2、shiny等。本书选取ggplot2包为代表讲解静态图表的绘制方法与步骤,选取plotly和recharts包为代表讲解动态交互图表的绘制方法与步骤,这些包可以解决大部分应用场景中遇到的数据可视化问题,其中,动态交互图表的绘制方法与步骤将在第11章详细介绍。