理论教育 探究数据仓库的特征

探究数据仓库的特征

时间:2023-06-06 理论教育 版权反馈
【摘要】:图9-6 数据仓库的特征1.数据仓库是面向主题的数据仓库是面向主题进行组织的。数据仓库的数据一般不进行删除,但是超过10年的数据都放入到归档库中。有些银行是将ODS放在数据仓库中建设。数据仓库尽量不做频繁修改。2)一般来说,数据仓库的数据会有存储期限,一旦超出了期限,过期数据就会被归档,或者直接删除。

探究数据仓库的特征

数据仓库有以下几个特征:面向主题的、集成的、相对稳定的和反映历史变化,如图9-6所示。

978-7-111-50289-0-Chapter09-6.jpg

图9-6 数据仓库的特征

1.数据仓库是面向主题的

数据仓库是面向主题进行组织的。什么是主题?主题是对业务数据的一种抽象,是从较高层次上对信息系统中的数据进行归纳和整理。面向主题的数据组织方式,就是在较高层次上对分析对象的描述,所谓面向主题的特性是根据业务的不同而进行的内容划分。

2.数据仓库是集成的

数据仓库中的数据是按照主题存储的,与业务系统中的数据可能会存在较大差别,数据仓库中的数据来源于不同的业务系统,因此,在进入到数据仓库之前,需要经历一个整合、清洗的过程,保证数据的一致性,同时进行数据的集成、计算和汇总。

集成的特性表现在:数据是独立分散的,如核心业务系统、电子渠道系统、信贷系统、票据系统,每个系统只保留单独的数据,如果进行公共的汇总,那么必须纳入到一个统一的平台进行分析、挖掘。这是数据仓库产生的根本动因,数据仓库也可以做一个公共标准,例如有的系统用0和1,分别代表男和女,有的用m和f代表,需要有一个统一的标准。

3.数据仓库是相对稳定的(www.daowen.com)

数据仓库通常保存数据不同历史时期的各种状态,并不对数据进行任何更新操作,一般来说,数据仓库的数据主要是做查询,以供企业决策分析之用。数据仓库中的数据反映的是很长时间内的历史数据,可以看作不同时点的数据库快照的集合。并且在这些快照的基础上进行统计分析。当操作型数据库经过联机处理后,将数据集成并且输入到数据仓库中。而数据仓库将这些历史数据保存起来,如果超出存储期限,这些数据可能会进行归档处理,或者进行删除操作。

因为数据仓库只进行数据查询的操作,并且查询量相对很大,对数据查询的效率提出了更好的要求。例如,可以利用索引、分区等技术对数据仓库进行优化。数据仓库的数据一般不进行删除,但是超过10年的数据都放入到归档库中。有些银行单独建设ODS,不仅给数据仓库供数,而且也为其他应用供数。有些银行是将ODS放在数据仓库中建设。

数据可以分成两类,即交易类的和状态类的。交易类的,每天都在增加,如还款记录。另一部分,是状态类的,如合同余额、借据余额。可以基于拉链或者快照的方式放入到数据仓库中。数据仓库尽量不做频繁修改。

4.数据仓库是反映历史变化的

数据仓库的历史特性是指数据保留时间戳字段,记录每个数据在不同时间点内的各种状态。数据仓库反映历史变化的特性表现在以下几个方面:

1)数据仓库不断地捕捉业务系统中已经变化的数据,然后将这些数据追加到数据仓库中,将不断生成的业务快照经过统一集成后进入到数据仓库中,对于捕捉到的新的变化数据只进行新增操作,而不进行更新操作。

2)一般来说,数据仓库的数据会有存储期限,一旦超出了期限,过期数据就会被归档,或者直接删除。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈