1.数据治理的现状与问题
如今,全球的各组织都认识到他们的数据资产的重要性和价值。与此同时,企业发现自己并未充分利用这些信息,原因在于缺乏数据的准确性、一致性、相关性和及时性。因此,数据治理被推到了前线。总体来说,目前国内企业所开展的数据治理工作还都处于初级阶段,很多企业的数据资产都或多或少地面临着各方面的问题。
1)在数据管理组织方面存在很多问题,大多数企业缺乏统一归口的数据管理组织,存在数据管理职责分散、能力不足、权责不明的问题,可谓“人人管理,无人负责”,致使数据管理的相关规范无法有效地执行和落实,也导致相应的数据管理监督措施无法得到落实。另外,企业范围内的数据考核体系也尚未建立,无法保障数据管理标准和规程的有效执行。
2)在数据标准方面,各业务部门制定自己的业务标准,部门之间的标准常常有矛盾或相互混淆;各个部门只专注于本部门业务有关的数据,部门间的数据共享能力差,往往形成信息孤岛。具体来看:①尚未建立企业级统一的数据编码,各业务部门根据自身的业务需要和系统要求,建立自己的数据编码,从而导致各类数据编码不一致,甚至发生冲突;②数据模型主要是在系统的建设过程中由各部门根据需要分别制定,导致数据模型不统一,甚至部分数据模型存在缺陷;③数据指标体系也主要是各业务部门根据系统建设的需求分别制定,对于指标的口径解释不一致,且部分数据指标缺失。
3)在数据质量方面,目前大多数企业内的数据质量管理主要由各专业部门分头进行,面临数据质量管理人员不足、知识与经验不够,以及监管方式不全面等多方面的问题;数据检查措施停留在专业线内部,专业线间缺乏交流,各自为政;跨专业的数据质量沟通机制不完善;缺乏清晰的跨专业的数据质量管控规范与标准,缺乏完善的数据质量管控流程和系统支撑能力,影响数据质量问题的分析和发现。
4)在数据安全管理方面,数据的可用性、完整性和保密性是数据安全的三大主题。对于企业而言,关键数据一旦遭遇灾难,整体工作就会陷入瘫痪,带来难以估量的损失。目前企业对数据安全的认识主要集中在数据安全策略和用户授权访问方面,在数据安全审计、数据安全事件处理和数据风险管理等方面的认识不够全面。部分部门设置了数据安全管理岗位,但职责仍有待明确。对数据安全级别的定义不统一,信息披露审批机制有待完善。
5)在数据生命周期管理方面,多数企业缺乏完善和统一的从数据的产生、使用、维护、备份到过时被销毁的数据生命周期管理规范和流程,不能确定过期和无效数据的识别条件,且非结构化数据未纳入数据生命周期的管理范畴;无信息化工具支撑数据生命周期状态的查询,未有效利用元数据管理。
总之,随着信息技术的高速发展,数据的重要性已被人们认知,数据就好像一座待开采的含有丰富矿藏的矿山,而数据治理则是具体的开采方法和手段。加强数据治理是提升信息化能力、提升精细化管理水平、提高业务运营效率、增强企业决策能力和核心竞争的重要途径。
2.数据治理的总体框架
要真正解决数据管理中存在的问题,“功夫”其实在数据之外,症结是管理的机制问题,这就是“数据治理”研究的内容。
简单来讲,数据治理是IT治理的重要组成部分,是以实现数据标准化为目标,以健全的数据组织为保障,以数据过程管控为手段,实现全面、高效的数据管理。从技术支持范围来讲,数据治理涵盖了从前端事务处理系统、后端业务数据库到终端的数据分析,从源头到终端再回到源头形成一个闭环的负反馈系统;从业务范围来讲,数据治理就是要对数据的产生、处置和使用进行监管;从控制范围来讲,数据治理必须通过对人员、流程和系统的整体设计和调整来满足数据与业务的全面结合。数据治理总体框架如图8-4所示。
图8-4 数据治理总体框架
数据治理的主要内容包括以下几个方面。
(1)数据管理的目标、策略和原则
目标、策略和原则都是对数据管理宏观方面的一些约束和说明。其中目标是数据治理工作的发展方向,如某企业的数据管理目标包含以下几项。
● 听得懂:统一数据“语言”,要求数据管理“有标准”,即具备完善的数据管理标准规范,保证在全集团内遵循并应用统一的数据标准。
● 不出错:在数据整个生命周期的各个环节建立完善的数据质量稽核机制,确保数据的准确性,要求企业具备完善的数据质量管理规范。
● 不乱改:明确数据的所有权及更改权限,制定完善的数据所有权管理规范,确保对数据的所有更改均有“法”可依,有“据”可查。
● 不丢失:建立数据的备份机制和容灾机制,制定完善的数据安全管理规范,确保所有数据有备份,可恢复。
● 不泄漏:根据内控和集团信息保密委员会的相关要求做好数据的保密工作,防止信息泄漏。
● 易使用:制定完善的数据服务管理规范,保证数据易获取、易应用,以充分发挥数据作为企业资产的价值。(www.daowen.com)
策略和原则是对如何开展数据治理的总体方针,如某企业的数据管理原则如下。
● 一次录入、全局共享:每个数据仅在第一次出现的时间和地点被获取/录入,以后在全局内部共享。
● 全员参与、分工协作:全员参与数据的输入与应用,但要明确不同部门在数据生命周期中的职责。
● 产权明晰、权责明确:每一信息单元都有唯一的拥有者,负责定义数据的使用规则和保护规则。
● 强化标准、有效管控:以标准为基础,通过质量管控实现数据完整性、有效性、一致性、规范性、开放性和共享性管理,提高数据质量。
(2)数据治理组织与职责
很多企业数据治理工作不到位、数据管理混乱的主要原因就是责任主体不清。有效的数据管理需要明确职责的组织支撑,企业首先需要强有力的领导支持和专业化团队的组织保障,承担整个企业的数据使用和管理职责。其次,要明确各个部门的数据管理职责,清晰定义数据与其所有者、相关利益方的关系,决定谁拥有这些数据、谁又以何种方式使用某些数据。
(3)全生命周期管控机制
数据从产生到集成、分析、利用是一个完整的生命周期,这个周期中的每个阶段出现问题都会导致数据价值难以充分发挥。以数据为主线从业务系统、数据交换、数据中心和分析应用等不同层面分析数据,设计一套适合企业自身的数据管控体系,建立数据生命周期各阶段的管理机制至关重要。
(4)数据治理专题
在数据治理中有一些专题是贯穿数据全生命周期的,这些专题非常重要,决定着数据治理的水平和能力,包括数据标准化管控体系和数据质量管控体系和数据安全管控体系等几部分。
● 数据标准化管控体系。数据标准的制定是实现数据标准化、规范化,以及实现数据整合的前提,是保证数据质量的主要条件。标准不是一成不变的,它会因为企业管理要求和业务需求而变化,也会因为社会的发展和科学的进步而不断的推进,这就要求企业对标准进行持续的改进和维护。
● 数据质量管控体系。作为信息系统的重要构成要素,数据质量问题是影响信息系统运行的关键因素,直接关系到信息系统建设的成败。根据“垃圾进,垃圾出”这条原理,为了使信息系统建设取得预期成果,就要求信息系统提供的数据质量是可靠的,如果数据质量得不到保证,信息化进程的实施就根本不可能达到预期效果。高质量的数据来源于数据设计、数据收集,以及数据分析、综合、展示活动的高品质和综合作用,这就需要建立一个有效的数据质量管理体系。
● 数据安全管控体系。数据是企业宝贵的资产,理应得到高规格的安全保障,要建立一系列对数据及相关信息系统的保护措施,使数据免遭未经授权的访问、使用、修改或删除,保证数据完整性、保密性和可用性。
(5)数据治理工具
数据治理不能停留在手工管理层次,而应将相关规划、制度、规范和流程等通过系统支撑实现,通过建设一个成熟、先进、科学的数据治理平台,从制度、标准、监控和流程几个方面提升数据管理能力。
由上可知,数据治理体系框架可以概括为“一个流程、两个维度”,一个流程是指数据全生命周期,从数据产生到数据应用的生命周期,两个维度是指管理与技术,这两者是同等重要的。图8-5所示是中国农业银行数据治理工作的总体框架。[1]
如图8-5所示,农业银行的数据管理工作框架包括3部分内容:一是数据管理体系,包括一套数据标准规范体系,描述农业银行到底有哪些数据及这些数据的属性,在全行建立起统一的语言;一套数据管理职责体系,描述各部门应承担的职责;一套数据考核评价体系,描述数据管理的考核评价手段。二是数据管理工作机制,把具体工作和具体问题通过规范的模板分解落实到具体部门,督促其限时完成,使数据管理体系在实际工作中能够运转起来,切实解决行内的各种数据问题,并将工作成果不断充实到数据管理体系中,形成数据管理的良性循环。三是数据管理系统平台,即依据统一的数据标准规范进行数据的集中采集、加工、发布和应用,并提供数据监测与考核的手段,及时发现数据质量问题,形成数据服务和数据管控的一体化工作平台,为数据管理体系提供有力的系统支撑。
总之,数据治理作为信息化过程中的必经之路,需要长期稳定、持续不懈的推进。目前,国内大多数企业的数据治理工作仍然偏重于技术,主要工作还停留在现有业务环节的数据问题等方面,包括现有数据的清理、查重、映射和标准化等内容,而对更深层次的数据治理体系还未有更多进展。企业要想真正使数据成为企业有价值的资产,就要从组织、标准化、质量、安全和工具等多个方面构建全生命周期的数据治理体系,不断探索建立数据治理机制的有效形式。
图8-5 中国农业银行数据治理工作总体框架
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。