元数据管理是管理企业的元数据信息,包括技术元数据、业务元数据和管理元数据。元数据管理的目标是获取、理解和共享企业的信息资产。
1.元数据管理功能
元数据管理功能主要包括:
●元数据采集
实现业务元数据的自动采集,完成技术元数据的自动匹配,实现对无法自动采集元数据信息的补录。
●元数据查询
提供技术元数据、业务元数据和管理元数据的信息查询,支持对元数据的统计。
●元数据版本管理
自动对元数据版本进行匹配,提供对元数据历史版本的查询和对比。
●元数据分析
实现数据管理相关的数据分布地图、数据血缘分析和影响性分析等。
2.元数据管理功能主要体现在以下几个方面:
(1)元数据采集
1)配置元数据采集器。
2)实现对业务元数据的自动采集。
3)自动匹配技术元数据的关联性。
(2)元数据自动补录
补录无法自动获取的元数据,对元数据信息进行修改和完善。
(3)元数据版本管理
1)对采集到的元数据信息进行版本比对。
2)对发生变化的元数据进行提醒。
3)支持历史各个版本元数据的查询。
(4)元数据查询
元数据查询包括数据映射、加工规则、数据标准信息、数据指标口径、数据分布等信息,如图6-53所示。(www.daowen.com)
图6-53 元数据查询
(5)元数据分析
元数据分析主要包括元数据血缘分析和元数据影响性分析。
1)元数据血缘分析。当发现报表中的指标有问题的时候,可以通过元数据的血缘分析追溯到该指标的下游系统到上游系统的转换流程中,帮助分析人员了解该指标的处理流程,为进一步定位问题提供帮助。血缘分析和影响性分析类似,但是方向相反。
触发血缘分析的方式:
①通过查询找到变化的目标表,经过血缘分析,发现变化的表是由上游哪些源引发的。
②如果在报表中发现某个指标有问题,可以进行血缘分析,分析该指标的数据加工过程,了解该指标出现问题的原因。
2)元数据影响性分析。在数据处理过程中,如果源系统的表结构或者属性发生变化,需要通过元数据的影响性分析,了解这些变化会影响数据处理流程中下游的哪些表结构或者属性。
3.元数据管理的几个角色
●元数据管理者
主要负责元数据收集、维护、录入,以及元数据版本管理、信息发布等工作。
●元数据消费者
包括对元数据基础信息的查询、信息分析等。
元数据管理框架主要包括管理政策、组织、流程和技术工具。其中管理政策包括元数据管理方法、元数据管理实施细则;组织包括元数据管理组织架构、元数据管理岗位职责;流程包括元数据申请、元数据审批、元数据实施和推广,以及元数据维护;技术工具主要是元数据管理系统,如图6-54所示。
4.数据标准和元数据的对比说明
1)从定义上来说,数据标准是经过相关机构确认和批准的规范性的文件,标准可以保障核心数据在使用和交换过程中的一致性和准确性。元数据是描述关于数据的数据,包括这些数据的定义、数据之间的关系等信息,可以分成业务元数据、技术元数据和管理元数据。
2)数据标准是为了更好地保障各个部门之间的数据共享。而元数据是对数据进行管理,方便数据检索,通过元数据的分析,更好地为数据分析人员服务。
图6-54 元数据管理框架
3)数据标准的实施和落地需要业务部门和技术部门之间的合作,业务部门参考数据标准规范文档制定业务规则,技术部门在系统的建设过程中参考该规范文档进行设计和开发。元数据的实施和落地通过元数据管理平台对数据进行血缘分析和影响性分析。
4)数据标准主要是统一业务和技术定义,目的是消除企业内部人员对于业务和技术术语的分歧,它是一种规范性的文档。元数据管理是对数据结构的描述,并且提供数据管理和分析的功能。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。