理论教育 数据仓库的特点与优势

数据仓库的特点与优势

更新时间:2025-01-03 理论教育 版权反馈
【摘要】:数据仓库不同于传统的数据库,其特点主要体现在“目标任务”“数据覆盖面”“数据粒度”“数据稳定性”“存取数据量”和“响应时间”等方面。数据仓库排除了对于决策无用的数据,提供了特定主题的全部视图。

数据仓库不同于传统的数据库,其特点主要体现在“目标任务”“数据覆盖面”“数据粒度”“数据稳定性”“存取数据量”和“响应时间”等方面。

1.面向主题

操作型数据库的数据组织面向事务处理任务,各个业务系统之间各自分离,而数据仓库中的数据是按照一定的主题域进行组织的。主题是与传统数据库的面向应用相对应的,是一个抽象概念,是在较高层次上将企业信息系统中的数据综合、归类并进行分析和利用的对象。每一个主题对应一个宏观的分析领域,通常的主题包括“财务”“成本”“采购”“生产”“库存”“销售”“人力资源”“质量”和“市场信息”等。数据仓库排除了对于决策无用的数据,提供了特定主题的全部视图。

2.集成的

数据仓库中的数据是在对原有分散的数据库数据进行抽取和清洗的基础上,经过系统加工、汇总和整理得到的,必须消除原始数据中的不一致性,以保证数据仓库内的信息是关于整个企业的、一致的、全局的信息,而不是一个一个的信息孤岛。

3.高度汇总的

一般来说,存储于数据仓库系统中用于做出管理决策的数据,大都是经过提炼之后的数据,而不是像在线交易系统那样,存储了作为明细级别的数据,以供业务操作使用,因此其数据的粒度相对数据库系统而言比较粗,也就是属于高度汇总的数据。(www.daowen.com)

4.相对稳定的

数据仓库中的数据主要供企业决策分析之用,所涉及的数据操作主要是数据查询,一旦某个数据进入数据仓库以后,一般情况下将被长期保留,也就是数据仓库中一般有大量的查询操作,但修改和删除操作很少,通常只需要定期的加载和刷新。

5.反映历史变化

数据仓库中的数据通常包含历史信息,系统记录了企业从过去某一时间点(如开始应用数据仓库的时间点)到目前的各个阶段的信息,通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测。而在应用这些历史数据时,系统读取和运算的数据往往是巨大的,有时候甚至可达几十亿条。

6.时效性要求低

假设读者去医院排队挂号,但是却被告知由于系统本身性能太差,而导致了挂号的延误,可想而知后果会是怎样的,因此对于数据库应用系统的时效性要求是非常高的。但是对于数据仓库而言,由于使用对象是数据探索者,因此对于时效性的要求不是那么高,只需要在可以接受的时间段内能够得到想要的结果即可,甚至有些时候被期望的时间可能长达一天或几天。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈