1.2 R语言特点
2025年09月26日
1.2 R语言特点
R语言是国外大学统计学和数据科学的推荐分析软件,具有开源免费、源包众多、面向应用、持续迭代等优点。R语言是解释型编程语言,采用函数式编程、向量化运算,代码采用脚本方式运行,与Java、C、C++等编译型语言相比,R语言更适合对数据集开展探索式分析。
R语言的一大优点是拥有数量众多且功能多样的第三方开源包,这些包通常托管在CRAN上,广大用户可以免费下载。从2007年开始,截至2021年4月,CRAN上托管的R包数量变动趋势如图1-4所示。
图1-4 CRAN上托管的R包数量变动趋势
自2012年以来,R语言及其全球社区发展迅速,CRAN上托管的第三方R包在2012—2020年的平均复合增速约为43%,由众多科研人员、专业数据分析师开发的R包不仅为跨领域复杂问题的解决提供了强大的软件支撑,也加快了前沿算法的应用落地。
R语言能完成的工作包括但不限于以下内容。
(1)R语言可完成互联网数据的采集(推荐使用rvest包)以及与常用数据库的数据读写交换(推荐使用MySQL包)。R语言与很多常用财经数据库(如wind等)都有接口,便于数据交换。
(2)R语言可完成本地数据的读写(readr包)、预处理(dplyr和tidyr包)以及各类算法的统计分析(各类包均可)。
(3)R语言可完成数据分析结果的可视化(ggplot2包和recharts包)。
(4)R语言可完成数据分析报告或网站部署。其中,“Rmarkdown+Knitr”做自动化报告,“shiny+flexdashboard”做网站部署。