2.1.1 三个世界及两类模型
现实世界中错综复杂的事物最终能以计算机所能理解和表现的形式反映到数据库中,这是一个逐步转化的过程。通常分为3个阶段,称为三个世界,即现实世界、信息世界和机器世界(或计算机世界)。
现实世界存在的客观事物及其联系,经过人脑的认识、分析和抽象后,用符号、图形等表达出来,即得到信息世界的信息,再将信息世界的信息进一步具体描述、规范并转换为计算机所能接受的形式,则成为机器世界的数据表示。三个世界及其关系如图2-1所示。
1)三个世界
(1)现实世界
现实世界就是客观存在的世界,它由客观存在的事物及其相互之间的联系组成。客观事物可以用对象和性质来描述。例如,客观事物是人,其性质有姓名、性别、出生日期、相貌等;客观事物是课程,其性质有课程名、课程类别、学分等。
图2-1 三个世界及其关系
(2)信息世界
信息世界是现实世界在人脑中的反映并用文字或者符号记载下来的,是对现实世界的抽象,又称观念世界。信息世界是一种相对抽象和概念化的世界,它介于现实世界和机器世界之间。
(3)机器世界
机器世界又称为数据世界,是将信息世界中的数据描述经过抽象和组织,按照特定的数据结构进行整理、分类和规范存储在计算机中,是信息世界中的信息数据化后对应的产物。
从上述分析看,现实世界中的客观事物是数据之源,是数据库系统的出发点和最终的归宿。信息世界是对现实世界的抽象。
2)两类模型
数据模型就是对现实世界的模拟,应该满足3方面的要求。一是能比较真实地模拟现实世界;二是容易为人所理解;三是便于在计算机上实现。
根据应用的不同层次和目的,数据模型可以划分为两类,即概念模型和结构数据模型。
(1)概念模型
按用户的观点对数据和信息建模,即用于信息世界的建模,所建立的是属于信息世界的模型,主要用于数据库的设计。
(2)结构数据模型
按计算机系统的观点对数据进行建模,所建立的是属于机器世界的模型,主要包括网络模型、层次模型、关系模型等,主要用于DBMS的实现。结构数据模型通常简称为数据模型,正因如此,常将其与含义更广泛的“数据模型”一词混淆,应根据上下文加以区分。