理论教育 了解ODS系统的设计原则、性能和实时数据整合功能

了解ODS系统的设计原则、性能和实时数据整合功能

时间:2023-06-06 理论教育 版权反馈
【摘要】:图7-29 ODS的设计原则可扩展性可扩展性是指ODS系统可以支持业务系统扩展的需要。例如,对于模型的设计,应该考虑业务源系统结构发生变化时对ODS系统带来的影响。高性能高性能是指ODS系统可以承受峰值时的系统压力和更多的应用,保证系统可以正常运行。实时性的数据整合功能ODS系统具有实时性的数据整合功能。

了解ODS系统的设计原则、性能和实时数据整合功能

1.ODS的概念

通过前几章的学习,我们已经知道数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持用户的辅助决策分析

而ODS(Operational Data Store,操作数据存储)则是一个面向主题的、集成的、可变的、反映当前细节的数据集合。它主要用于支持企业处理业务应用和存储面向主题的、即时性的集成数据,为企业决策者提供当前细节性的数据,通常作为数据仓库的过渡阶段。

2.ODS建设原因

ODS系统建设的原因有多种,主要原因有:

1)系统重复开发,造成资源极度浪费。不同应用之间,可能存在相同的数据抽取需求,经过多次抽取,浪费网络存储资源,造成不同应用系统之间数据的不一致性,同时也会给业务系统带来沉重的压力

2)一般来说,业务部门需要的信息可能来自于多个系统,但是由于各个系统之间的数据可能会出现口径不一致,数据不规范的现象,因此大大增加了临时抽取数据的难度,同时很难保证数据的一致性和准确性。

综上所述,通过ODS系统的建设,既可以大大缩短应用系统的实施路径,减少重复性的设计和开发,又可以提高数据的响应速度和准确性,为以后的数据挖掘和分析打下基础。

3.ODS的特点

业务数据经过ETL数据抽取、转换、加载,进入到ODS系统中,为企业提供了一种全局的、集成的和反映当前实时性的视角,在支持企业决策分析需求的同时,还能够在业务系统和数据仓库之间构建一个数据缓冲带,使得数据之间的传输和转换变得相对容易。

ODS系统的主要功能就是将多个业务系统中不同的数据源进行数据集成,通过数据抽取、转换、加载,将数据放入到共享的存储区中,以保证数据的一致性。

ODS具有以下特点:

1)数据是不断更新和易丢失的,当新的业务数据进入到ODS时,旧的数据会被新数据覆盖或者更新,一般不存储历史数据,只反映当前实时性的信息。

2)ODS系统一般存储的都是细节性的信息,很少有汇总的数据,即ODS包含粒度级别最低的数据。

3)ODS系统支持快速的数据更新操作,数据刷新频率很快,一般不保存过期的历史数据。

4)ODS系统一般存储在关系数据库中,通过将各个业务系统的数据集成起来,组成企业的全局统一性视图,实现ODS的数据共享功能。

5)用户可以频繁访问ODS系统,因为它是基于操作型应用的。

4.ODS设计原则

ODS的设计原则包括可扩展性、高可用性、可重用性和高性能,如图7-29所示。

978-7-111-50289-0-Chapter07-30.jpg

图7-29 ODS的设计原则

(1)可扩展性

可扩展性是指ODS系统可以支持业务系统扩展的需要。举例来说,设计ODS数据模型的时候,应该充分考虑新旧系统的业务数据模型能够扩展到ODS系统中。

(2)高可用性

高可用性是指系统发生变化的时候,可以依赖架构的灵活性,仍能保证系统的正常运行。例如,对于模型的设计,应该考虑业务源系统结构发生变化时对ODS系统带来的影响。也就是说,局部模型的扩展不会影响到ODS数据模型。

(3)可重用性

可重用性是指尽量避免重复的系统建设,尽可能考虑物理设备、系统软件、模型以及应用上的复用。举例来说,对于ETL处理流程,分析ETL任务的各个环节,找出公共的组件,进行封装,然后进行复用。

(4)高性能

高性能是指ODS系统可以承受峰值时的系统压力和更多的应用,保证系统可以正常运行。

5.ODS的主要功能

ODS的主要功能如图7-30所示。

(1)作为业务系统和数据仓库之间的隔离地带

一般来说,数据仓库系统的数据来源非常复杂,数据可能存储在不同的应用系统和业务数据库中,为了满足数据仓库对业务数据的抽取标准,需要在应用系统和数据仓库系统之间建立一个“隔离墙”,如图7-31所示。ODS系统作为“隔离墙”的目的是临时存储多个业务源数据,经过一系列的清洗、转换并达到数据仓库对数据的要求后,再将数据加载到数据仓库中。

在业务系统中直接将数据抽取到数据仓库中并不容易,ODS系统作为业务系统和数据仓库系统之间的隔离地带,用于存放从业务系统抽取出来的数据,为数据仓库提供了平整、可靠的数据源。(www.daowen.com)

978-7-111-50289-0-Chapter07-31.jpg

图7-30 ODS的主要功能

978-7-111-50289-0-Chapter07-32.jpg

图7-31 ODS的“隔离墙”功能

(2)降低业务系统的压力

在数据仓库建立之前,大量的决策分析报表是由业务系统直接生成的,在报表生成过程中可能存在复杂的计算,对业务系统的运行产生非常大的压力。在建立ODS系统之后,原来由业务系统直接产生的复杂报表、对细节数据的查询都能够在ODS系统中进行,从而有效降低了业务系统的查询压力,提高了业务系统的运行效率

(3)满足从微观角度查询细节数据的要求

一般来说,在数据仓库体系结构中,数据仓库层存储的数据都是经过轻度汇总的数据和历史数据,几乎不存储任何生产运营过程中产生的细节数据。但是,为了满足特殊用户群体的要求,可能需要对一些交易数据进行查询,这时需要把查询这些交易数据的功能让ODS系统来实现。通常,ODS系统支持多维分析的功能,因为它也是面向主题的和集成的。数据仓库从宏观上支持多维决策分析,而ODS系统从微观角度描述细节性的数据查询。

(4)实时性的数据整合功能

ODS系统具有实时性的数据整合功能。它通过ETL技术,实时地从各个业务系统中抽取企业的运营交易数据,通过数据转换、清洗、加载等操作最终形成共享数据,为企业提供统一的数据视图。这种数据整合功能有助于提高数据的一致性,为数据仓库提供优质的数据源。

(5)检查数据质量的功能

ODS系统具有完善的数据质量检查功能。它通过对企业数据的质量检查和质量评估,完善企业内部的组织机构,支持对数据质量管理流程的监控,从而实现对源数据质量问题的发现和修正。

(6)为企业提供统一的数据视图和数据共享功能

ODS系统为企业提供统一的数据视图和数据共享功能。它通过对各个业务系统运维数据的集成,实现ODS的数据共享,同时为企业提供全局的统一数据视图。

6.ODS的设计步骤

ODS的设计步骤如图7-32所示。

(1)数据调研

数据调研主要是根据业务人员提供的需求意向,将业务系统划分成几个模块,并对各个模块所涉及的数据和数据源进行调研分析。数据调研分析可以分成编号、模块名称、数据来源(包括导入和输入)、备注等信息,见表7-2

978-7-111-50289-0-Chapter07-33.jpg

图7-32 ODS系统的设计步骤

表7-2 数据调研分析表

978-7-111-50289-0-Chapter07-34.jpg

(2)确定数据范围

确定数据范围是在需求调研的基础上进行的。为了保证所需的数据都能够从业务系统中得到,需要将应用需求与ODS的数据范围结合起来,也就是对ODS进行主题的划分。通常来说,ODS主题的划分是以企业的业务模型为基础,通过参考各种业务系统信息模型,得到ODS数据主题的范围,根据该范围进行ODS主题的定义,从而确定ODS的数据范围。

(3)设计主题元素

ODS系统的主题元素主要包括主题名称、维度、度量值、粒度、存储的时间,下面分别进行介绍。

●主题名称:说明该主题主要包含哪些分析数据,用户重点关注的对象是什么。

●维度:说明数据分析时的角度有哪些,如时间维度的年、季、月、日等。

●度量值:说明用户关注的指标值,如工资额、销售量等。

●粒度:是指对数据的细化程度。一般来说,细化程度越高,粒度级别就越低;细化程度越低,粒度级别就越高。

●存储的时间:主要描述数据的存储周期和存储期限是多少。

(4)ODS系统的物理实现

ODS系统的物理实现主要包括数据库的物理实现、数据抽取的设计等内容。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈