金融行业的数据是推动商业银行等金融机构变革的主要推动力。目前来说,商业银行之间的竞争越来越激烈。商业银行的发展需要良性的差异化竞争,数据是竞争的基础条件。很多金融机构通过数据分析指导日常运营,为客户提供更好的服务和产品,同时降低商业银行运营的风险,获取竞争的优势。
金融机构每天都在产生大量的数据,包括各种文本、视频、图片、日志、音频和地理位置等信息,但是这些数据之间还存在着很多问题,如数据存在分割、标准不统一、难以共享等问题。
上述这些问题导致出现了大量的信息孤岛,从而难以利用这些宝贵的数据做出有效的决策分析。很早以前,商业银行的数据架构都是以统计报表为主。在信息化的建设过程中,各个系统之间的数据定义、数据采集流程缺少体系建设,信息之间难以共享。同一数据可能在多个系统中重复录入和存储。优秀的数据架构在金融行业中显得尤为重要。
在所有行业中,银行的数据管理其实是比较困难的。
1)商业银行的IT系统建设较早,随着时间的流逝,系统变得越来越复杂。
2)商业银行对于数据的准确性要求是极高的,但很多银行的数据并没有统一的标准,不同系统之间的数据还存在不一致和不完整的现象。
3)关于商业银行的数据架构、数据治理和管控是非常重要的。
金融行业的数据架构一般包括以下几个部分:数据采集层、产品加工层和对外服务层,如图12-5所示。
从数据源开始,经过加载、集中、整合,以及对外服务这几个过程,可以将整个数据架构横向划分成:源数据区、基础区、产品加工区和产品服务区,如图12-6所示。各个区域都相对独立。
图12-5 金融行业的数据架构
图12-6 数据架构的横向划分
●源数据区
在源数据区中,可以进行并行处理,设计多个加载通道,提高加载的并行度和加载效率。在数据加载入库之后,再进行逻辑校验,包括对错误数据的反馈,然后使用快速迁移技术,将数据迁移到基础区中,最后将加载库的数据清空,以备下一阶段的数据加载。
●基础区
基础区中存储的是数据采集的信息,以满足对新增数据的采集、加载和整合,最后为产品加工做准备。
●产品加工区
产品加工区主要面向应用,包括对数据类、解决方案类和服务类等产品的加工。产品加工区可以分成数据集中区和加工单元区。
(1)数据集中区
产品加工区的数据都来源于基础区,一般来说,产品加工的时间较长,为保证产品加工和数据加载都有相对独立的时间窗口,在产品加工区划出一个数据集中区,作为缓冲层,如图12-7所示。
图12-7 数据集中区
根据产品加工的需求,定期从基础区中抽取产品加工需要的数据,在产品加工之前建立一个数据集中区,目的是降低基础区和产品加工区之间的耦合性,同时根据加工频率的不同,将数据集中区分成日迁移和月迁移的数据。
对于日加工的数据,每天都需要根据数据加载量,完成当日的加载任务,同时为了避免不同产品之间加工过程的相互影响,可以为每类日加工建立相对独立的数据库实例。
对于月加工的数据,每月迁移一次数据,为了保证不同种类的产品数据加工的一致性。
在采用批量数据迁移的同时,考虑在数据迁移的时候暂停数据加工服务,尽量避免数据迁移和加工同时进行。
(2)加工单元区
在加工单元区中,提供各类产品加工的原子数据,如图12-8所示。(www.daowen.com)
图12-8 加工单元区
对于加工单元区来说,应该满足产品加工时高性能的数据处理要求,从整体上来说,产品加工流程是批量的,并且利用并行处理技术,实现不同产品的加工需求。
●产品服务区
产品服务区主要提供对外服务,存储数据类与工具类产品的数据,以及各种产品查询记录,如图12-9所示。
图12-9 产品服务区
产品从整体上可以分为离线查询产品和实时查询产品,两类产品分别采用不同的数据组织形式,对于实时查询产品,可以快速地反馈查询结果。
产品服务区的数据按照产品更新频度又分为日更新和月更新两种类型,更新频度不同的产品提供服务的时间范围不同,日迁移产品可以提供全天的服务。各种产品查询的记录统一存储在产品服务区中,根据产品加工的需求,定期将查询记录迁移至产品加工区。
产品服务区的建设方案:
首先应该建设数据采集平台,将采集到的数据加载到基础库中,实现数据处理的批量化,可以利用多加载通道实现并行加载的功能。
其次,利用数据仓库技术进行多维分析和挖掘。一般来说,数据仓库包括数据获取层、数据存储层和前端应用层,如图12-10所示。
●数据获取层
数据获取层把基础层相关的数据经过抽取、转换和清洗,按照统一的模式和不同的主题进行集成,装载到数据仓库中。
●数据存储层
数据存储层主要包括数据仓库和数据集市。数据仓库整合系统全局的共享信息,它包含历史数据信息,记录了过去某一时间点到目前各个阶段的信息,通过这些信息,可以对企业的发展状况和未来趋势做出分析和预测。数据集市是为了特定的目的和范围,从数据仓库中独立出来的一部分数据。
●前端应用层
前端应用层包括统计报表和数据挖掘,为用户访问数据仓库提供了手段。同时也预留了专业统计分析软件的接口。
图12-10 数据获取层、数据存储层和前端应用层
金融行业数据架构的特点,如图12-11所示。
图12-11 金融行业数据架构的特点
1)对于商业银行来说,为了全面了解客户的需求,并且提高服务的质量,需要把客户的数据集中起来,并且使用数据仓库进行有效的管理。
2)一般来说,银行使用数据库技术支持各种交易业务。数据仓库是把企业内部的分散的数据库进行集成,形成统一的存储体系,相对于数据库来说,数据仓库不仅仅是存放数据的地方,同时还担负着把信息转化成知识,知识转化成价值的责任。
3)利用数据仓库技术可以为银行带来很多利益。例如,通过数据仓库可以使业务人员对客户有一个全面的了解,提高对客户的服务质量。
4)通过数据仓库技术,对诸如ATM交易信息和柜台交易信息进行整合,为客户提供有针对性的服务。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。