大数据的时代特征
近代科学数据化的起源从天文学、物理学开始,逐渐迈向化学、生物学、人类学、经济学、管理学和社会学等,从自然世界逐渐向人类社会延伸。由于科学技术的发展,对世界认识工具的进步也是渐进的,然而人类对世界数据化的脚步经过了漫长的历程,直到第二次工业革命之后电子数字计算机的发明,才加快了发展进程,人类由此走进了信息社会,迎来了信息时代。特别是随着计算机从统计学计算走向信息预判、决策管理,以及智能设备的微型化、移动化和网络化,数据的采集、存储、传输和处理都变得越来越容易,因此数据化的脚步明显加快,信息社会的构想基本上得到了实现。
对于大数据的定义,从字面来看,大数据是指规模特别巨大的数据库,所以此前也被称为海量数据,这主要是从数据规模的大小来界定的。但究竟到达什么规模才算大数据?古人说学富五车、汗牛充栋来形容个人学识渊博、社会知识爆炸,但现在看来却是微不足道的。如今数据诞生的速度按著名的摩尔定律基本上每半年就要翻番,美国国会图书馆的所有文献与现在爆炸的大数据相比只能望数兴叹。现在的数据量用传统的方法根本无法驾驭,所以大数据就是指超出传统处理能力,必须引入新的科学技术和现代化工具才能够进行处理的数据集合。与小数据相比,大数据不仅表现为规模浩大,而且在采集和处理速度、数据类型诸多方面都有本质的差别,因此美国Gartner公司将大数据表述为:“大数据是指数量巨大、速度快捷、种类繁多的信息财富,这些数据需要新的技术手段来处理,以便提高决策制定、领悟发现以及过程优化等能力。”由此可得出大数据的如下5V特点:大价值(Value)、大体量(Volume)、多样性(Variety)、准确性(Veracity)、时效性(Velocity),数据类型多样(涵盖不同来源、格式、结构)。(https://www.daowen.com)
当前人类科学研究进入到数据密集的第四范式,大数据技术是信息时代的一个重要的里程碑阶段。历史上的技术变革给科学认识带来新的挑战和机遇,例如,望远镜让天文学家可以观测更遥远的宇宙太空,显微镜让科学家可以观测到微观世界,现代科学技术让人类开始认识量子世界。当前大数据技术让人类认识未知世界,正在开启一次重大的时代转型,它必然会向传统认识论提出种种挑战,并让人们通过这种收集和分析海量数据的新技术获得新认知、创造新价值,帮助我们改变认知和理解世界的方式,为科学认识的深入提供新手段。
医疗健康是数据最为集中的领域,利用数据优势,通过数据转型,促进医疗卫生改革,这也带来了颠覆式发展的机遇,不断实现大数据与健康领域的深度融合。互联网、5G、人工智能、大数据、物联网等信息技术快速发展,健康领域由传统的服务和管理模式向数字化转型。数据挖掘技术的发展加快了健康数字化标准体系的形成,引导医疗健康领域建设、运行、发展、管理的全面创新发展,同时促进健康数字化相关政策成熟,支撑健康数字化整体转型的良好环境。