3.2.2 数据分析种类
1.描述性分析
描述性分析通过挖掘历史数据,关注发生了什么问题,是对过去的洞察。描述性分析使用数据聚合和数据挖掘等技术来提供对历史上所发生事情的理解,从描述性分析中可以学到很多东西。描述性分析的常见例子是提供问题答案的报告,比如去年某区域有多少孩子入学,有多少孩子因为什么原因而迁至另外的区域入学。描述性分析是大数据分析的第一种形式。现在大多数的组织机构仍然缺乏制作基本水平的描述性分析报告能力,主要是因为缺乏可用的了解专业知识的人才或没有适当的组织机构支持,可能导致虽然收集到数据却从未使用过。目前,很多行业都因为以前各自建设了大量的信息系统,从而产生了数据孤岛,数据长期没有流通。只有通过数据集互相链接,数据才能变得更有价值。例如,在医疗卫生信息中,将医生预约与住院、药物依从性以及获得服务联系起来,可以为医疗服务的优化和成本节约提供更好的支持。
描述性分析虽然很有用,但其局限性在于它只是基于过去的一个快照,并不总是能够正确地预示着未来,所以它对指导决策的能力其实是有限的。
2.诊断分析
诊断分析是一种分析形式,针对现实所产生的问题,它通过分析数据来回答为什么会发生这样的问题。诊断分析通常包括决策数据、数据发现、数据挖掘等技术。(https://www.daowen.com)
3.预测分析
预测分析使我们能够理解未来,并预测未来结果的可能性。预测分析使用历史数据和当前数据来预测未来事件或各种结果的可能性。预测分析中常会使用如回归分析、多重变量分析、数据挖掘、模式匹配、预测建模和机器学习等知识。
4.规范性分析
规范性分析力求为最佳结果作出决策,也就是说,利用所有可用的数据和分析来推演一个决策,以决定采取什么行动,也就是更明智的决策。规范性分析试图量化未来决策的影响,以便在作出决策之前就对可能发生的结果提出建议。在最好的情况下,规范性分析不仅预测了将要发生的事情,而且还预测了为什么它会发生,以及给出预测后如何行动的建议。规范分析使用人工智能技术和工具的组合,如机器学习、数据挖掘和计算建模过程。这些技术应用于来自许多不同数据集的输入,包括历史和事务数据、实时数据和大数据集。