1.2.4 高级数据库系统管理阶段
20世纪80年代以来,数据库技术在商业领域的巨大成功刺激了其他领域对数据库技术需求的迅速增长。这些新的领域为数据库应用开辟了新的天地,同时在应用中提出的一些新的数据管理需求也直接推动了数据库技术的研究与发展,尤其是面向对象的数据库系统。同时,数据库技术不断与其他计算机分支结合向高级数据库技术发展。例如,数据库技术与分布式处理技术相结合出现了分布式数据库系统,数据库技术与并行处理技术相结合出现了并行数据库系统等。
(1)面向对象的数据库系统
面向对象的数据库系统(Object Oriented Database,OODB)是面向对象的程序设计技术与数据库技术相结合的产物,也是为了满足新的数据库应用需求而产生的新一代数据库系统。面向对象数据库系统的主要特点是具有面向对象技术的封装性和继承性,提高了软件的可重用性。把面向对象的方法和数据库技术结合起来就可以使数据库系统的分析和设计最大限度与人们对客观世界的认识相统一,其通过类似面向对象语言的语法操作数据库,通过对象的方式存取数据库。比较典型的面向对象数据库的代表是DB4O和Versant。
面向对象数据库的特点如下:
①易维护。采用面向对象的思想设计结构,可读性高。由于继承的存在,即使需求发生变化,维护也只是在局部模块,维护起来非常方便。
②质量高。具有面向对象技术的封装性(数据与操作定义在一起)和继承性(继承数据结构和操作)的特点,提高了软件的可重用性。在设计时,可重用已有的稳定的基类,使系统满足业务需求并具有较高的质量。
③效率高。在软件开发时,根据设计需要对现实世界的事物进行抽象,产生类。使用这样的方法解决问题,接近于日常生活和自然的思考方式,必然会提高软件开发的效率。
④易扩展。由于面向对象具有继承、封装、多态的特点,自然可以设计出高内聚、低耦合的系统结构,使系统更灵活,更容易扩展,而且成本较低。
(2)分布式数据库系统
随着地域上分散而管理上集中的企业不断增加,其对数据的需求不再局限于本地,而要求能存取异地数据。同时,网络技术的飞速发展为实现这一需求提供了物质基础,于是产生了分布式数据库系统。
分布式数据库系统(Distributed Database System,DDBS)是数据库在地理上分布在计算机网络的不同结点,而管理和控制又需要不同程度的集中,在逻辑上属于同一系统的数据库系统。分布式数据库系统不仅能支持局部应用,存取本结点或另外结点的数据,而且能支持全局应用,同时存取两个或两个以上结点的数据。每个结点的数据库是可以自治的,每个节点都有自己的计算软硬件资源、数据库、数据库管理系统。目前,Hadoop的分布式文件系统(Hadoop Distributed File System,HDFS)作为开源的分布式平台,为目前流行的HBase等分布式数据库提供了支持。图1-5所示是一个涉及多个节点的分布式数据库系统。
图1-5 分布式数据库系统
分布式数据库系统的特点如下:
①高可扩展性:分布式数据库能够动态地增加存储结点,以实现存储容量的线性扩展。
②高并发性:分布式数据库必须及时响应大规模用户的读/写请求,能对海量数据进行随机读/写。
③高可用性:分布式数据库必须提供容错机制,能够实现对数据的冗余备份,保证数据和服务的高度可靠性。
(3)多媒体数据库系统
多媒体数据库系统(Multi-media Database System,MDBS)是数据库技术与多媒体技术相结合的产物。多媒体数据库技术是研究并实现对多媒体数据的综合管理,即对多媒体对象的建模,对各种媒体数据的获取、存储、管理和查询。
由于多媒体数据具有数据量大、结构复杂、时序性强、数据传输连续性等特点,多媒体数据库管理系统应具有如下功能:
①能够有效地表达、存储、处理多种媒体数据。
②必须能反映和管理各种媒体数据的特性,或各种媒体数据之间的空间或时间的关联。
③能够像其他格式化数据一样对多媒体数据进行操作。
④具有开放功能,提供多媒体数据库的应用程序接口等。
图1-6是一个主从式多媒体数据库系统。
图1-6 主从式多媒体数据库系统
(4)数据仓库
数据仓库(Data Warehouse,DW)是一个面向主题的、集成的、不可更新的、随时间不断变化的数据集合,它用于支持企业或组织的决策分析处理。数据仓库的主要功能是提供企业决策支持系统(DSS)或行政和信息系统(EIS)所需要的信息,它把企业日常营运中分散不一致的数据经归纳整理后转换为集中统一的、可随时取用的深层信息。
数据仓库作为决策支持系统的有效解决方案,涉及3个方面的技术内容:数据仓库技术、联机分析处理技术和数据挖掘技术。
数据挖掘就是从大量数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程。数据挖掘的广义观点就是从存放在数据库、数据仓库或其他信息库中的大量的数据中“挖掘”有趣知识的过程。
数据仓库是数据库技术结合数学与管理模型,可以为企事业单位访问数据提供方便和强大的分析工具,从企事业单位数据中获得有较大价值的信息,指导企事业单位决策,发掘企事业单位的竞争优势,以提高企事业单位的运行效率。数据仓库技术示意图,如图1-7所示。
图1-7 数据仓库技术
(5)并行数据库系统
并行数据库系统(Parallel Database System,PDBS)是新一代高性能的数据库系统,是在大规模并行处理(Massively Parallel Processing,MPP)和集群并行计算环境的基础上建立的数据库系统。它利用并行计算技术使数个、数十甚至成百上千台计算机协同工作,实现并行数据管理和并行查询的功能,提供一个高性能、高可靠性、高扩展性的数据库管理系统,能够快速查询大量数据并处理大量的事务。并行数据库系统的目标是通过多个节点并行执行数据库任务,以提高整个数据库系统的性能。