3.2.1 数据分析的演变

3.2.1 数据分析的演变

数据的价值体现在将其转换为信息的能力上,这种能力可以提升洞察力来驱动行为和工作流。数据分析是数据科学的一个子集,旨在从原始数据的来源获取洞察力。如今在分析大数据方面的进步使得研究人员能够在几分钟内解码人类DNA,并确定哪种基因最有可能导致特定的疾病。当然,还有哪些广告你最有可能在社交媒体上做出回应。对大数据的分析可以帮助组织理解包含在数据中的信息,以及识别对业务目标、结果和决策最重要的数据。利益相关者通常需要具有数据分析的知识。

作为一个概念,数据分析已经经历了几次迭代。数据分析1.0采用了对小型、慢速数据集的传统分析方法,通常采用电子表格和静态文档的形式,适用于小数据。典型的数据分析是基于描述性的和报告性的,数据通常是结构化的。这在20世纪90年代推动了商业智能的发展,带来了预定义的查询和详细的历史性视图——通常由可视化的仪表盘利用结构化数据,如客户数据、行为数据、销售数据、病人记录等,在传统的关系数据库中收集、聚合和分析生产过程、销售、交互和事务的数据。在数据分析1.0时代,数据科学家花费大量时间准备用于分析的数据,而不是自己进行分析。

数据分析2.0标志着大数据与传统分析的整合,其界面支持对大数据集的实时查询。大数据分析始于2000年,其通过复杂的查询和预测视图相结合,利用结构化和非结构化数据,如社交媒体、行为数据和日益增长的用户数据,来促进企业或组织在业务洞察力方面的提升。大数据使用Hadoop这样的框架进行处理,Hadoop是一种开源软件框架,可以在云端或在线平台上的并行服务器上快速批量处理数据。

随着非结构化数据库的流行,大数据项目将不仅仅支持传统的SQL数据库,还支持文档、图形、地理空间等非结构化数据。同时,这一时期还引入了其他大数据技术,包括用于快速响应分析任务的“内存”分析,即数据直接存放在内存中而不是在磁盘中管理和处理。(https://www.daowen.com)

大数据是现有产业升级与新产业诞生的重要推动力量。数据为王的大数据时代的到来,产业界需求与关注点发生了重大转变:企业关注的重点转向数据,计算机行业正在转变为真正的信息行业,从追求计算速度转变为关注大数据处理能力,软件也将从编程为主转变为以数据为中心。在大数据的应用中,数据分析无疑是人们最关注的方向。

当前,大量的数据正通过各式各样的终端来产生,因此传统的分析方法已经行不通。企业无论是在制造产品、搬运产品、消费产品,还是与消费者交互的环节,都会在这些终端设备上拥有越来越多的数据。每一个装置,每一批货物,每一个人,都会留下痕迹。

数据分析3.0标志着数据分析进入成熟阶段。在这个阶段,人们认识到通过把传统分析和大数据相结合可以对业务产生积极影响,并且支持快速的洞察发现业务和决策点的实时分析。数据分析3.0主要是传统商业智能、大数据及物联网的组合。人们可以为了特定受众的利益而分析这些数据集,以达到他们的目的,无论是改善成绩还是提高资源配置;还可以将高级分析和优化嵌入每一个产品或服务决策中,这些决策都是在第一线第一时间做出的,在大多数高速成长的互联网公司里,如阿里、腾讯等都通过建设强大的数据能力为业务部门提供实时、强有力的支撑,为其业务高速发展提供了强有力的引擎。