理论教育 数据管理平台架构设计优化方案

数据管理平台架构设计优化方案

时间:2023-05-23 理论教育 版权反馈
【摘要】:数据架构不仅需要准确地反映和实现企业现有的业务逻辑和未来的发展战略,而且能够针对数据的生命周期进行全过程管理,这就是数据管理平台要承担的任务。图6-8 传统数据管理平台总结框架数据源:主要描述数据管理系统的数据来源,通过抓取工具采集到数据管理系统中来。一般会通过元数据资料库来统一地存储和管理元数据,其主要目的是使传统数据仓库的设计、部署、操作和管理能达成协同和一致。

数据管理平台架构设计优化方案

数据架构不仅需要准确地反映和实现企业现有的业务逻辑和未来的发展战略,而且能够针对数据的生命周期进行全过程管理,这就是数据管理平台要承担的任务。

企业级的数据管理平台一般分为以下几部分,即数据源、企业数据中心、应用开发平台、元数据管理、系统维护前端展示,具体如图6-8所示。

978-7-111-52778-7-Chapter06-10.jpg

图6-8 传统数据管理平台总结框架

数据源:主要描述数据管理系统的数据来源,通过抓取工具采集到数据管理系统中来。数据有不同的源头,格式和标准也可能不同。

ETL:传统数据仓库从各数据源获取数据,以及在数据仓库内的数据转换和流动都可以认为是ETL(抽取Extra、转化Transfer、装载Load)的过程,ETL是数据仓库的流水线,它维系着数据仓库中数据的新陈代谢,而数据仓库日常的管理和维护工作的大部分工作就是保持ETL的正常和稳定运行。

ODS:ODS(Operating Data Store,操作型数据存储)是介于源数据库和数据仓库之间的一种数据存储技术。数据源在被载入数据仓库之前,都会以符合第三范式的形式存储在ODS中。与面向应用的分散的数据库相比,ODS中的数据组织方式和数据仓库一样也是面向主题的和集成的,对进入ODS的数据也像进入数据仓库的数据一样进行转换和集成处理。另外,ODS只是存放当前或接近当前的数据,如果需要的话,可以对ODS中的数据进行增删、更新等操作。虽然DW中的数据也是面向主题和集成的,但这些数据一般不进行修改,所以ODS和DW的区别主要体现数据的可变性和当前性上。

数据仓库:数据仓库中存储的是经过ETL处理后的结构化数据,是面向主题的、集成的、不可更新的、随时间不断变化的数据集合,数据模型满足第三范式,用以支持经营管理中的决策制定过程和数据仓库中的数据面向主题,与传统数据库面向应用相对应。

数据集市:数据集市(Data Mart)也称数据市场,是一个为某个部门或专业人员服务的小型数据仓库。数据集市中的数据模型是按照星形模型进行组织的,因此,从数据仓库到数据集市的数据转移应该重点考虑从规范化建模到多维建模的映射,包括实体表到事实表、维表的映射,以及实体间关系到多维关系的映射等。

数据分析与展现:在数据仓库或数据集市层完成了数据的处理与存储后,数据将会应用到数据应用层,进行分析与挖掘。主要方式如表6-3所示。

表6-3 传统数据分析的几种方式(www.daowen.com)

978-7-111-52778-7-Chapter06-11.jpg

(续)

978-7-111-52778-7-Chapter06-12.jpg

元数据管理:元数据即描述数据的数据,用于描述要素、数据集或数据集系列的内容、覆盖范围、质量、管理方式、数据的所有者及数据的提供方式等有关的信息。元数据主要记录传统数据仓库中模型的定义、各层级间的映射关系、监控传统数据仓库的数据状态及ETL的任务运行状态等。一般会通过元数据资料库来统一地存储和管理元数据,其主要目的是使传统数据仓库的设计、部署、操作和管理能达成协同和一致。

这一架构的数据管理系统目前应用很广,但它也存在很多不足,最为明显的有以下几项。

1)硬件成本高。目前,集中式的数据存储和处理,在硬件软件选型时,基本采用的方式都是配置相当高的大型机小型机服务器,以及访问速度快、保障性高的磁盘阵列,这些硬件设备都非常昂贵,动辄高达数百万元;软件也是Oracle、IBM、SAP和微软等国外大厂商的产品,软硬件的维护都需要专业技术人员,成本很高。

2)扩展能力有限。因为传统数据管理系统是单节点的,其存储能力与计算能力完全依靠服务器的硬件配置,在很大程度上限制了扩展能力,当数据量越来越大,并发读写量也越来越大时,集中式的文件系统或单数据库操作将成为致命的性能瓶颈。在面对大数据量的导入导出、统计分析和检索查询时,由于依赖于集中式的数据存储和索引,系统性能随着数据量的增长而急速下降,对于那些需要实时响应的统计及查询场景则更是无能为力。

3)仅擅长处理结构化数据:传统数据管理系统擅长处理结构化数据,而对海量的非结构化数据无能为力,这通常意味着不少有价值的数据无法得到有效处理。

总之,“互联网+”时代,各种业务数据正以几何级数的形式爆发,其格式、收集、储存、检索、分析和应用等诸多问题,不再能以传统的信息处理技术加以解决,对实现数字社会、网络社会和智能社会带来了极大的障碍,要解决这些难题,就需要大数据技术出马了。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈