对于数据架构来说,可以从几个方面去了解现状存在的问题是什么。例如,判断数据架构的原则是否清晰、架构层次的划分是否合理等内容。
(1)数据架构的原则是否清晰
判断现状中作为数据架构设计的指导原则是否清晰,是否能成为数据架构和数据治理可以遵循的依据。
(2)架构层次的划分是否合理
从数据分布、数据流转的角度判断当前的数据架构是否合理。
例如,对于数据分布来说,是否有缺失的层级,数据的分布是否混乱,该分布是否引起效率的问题。对于数据流转来说,是否过于重叠、复杂,是否有数据不一致的风险。
(3)数据采集方式
对于数据采集来说,我们需要了解采集的方式是什么,例如是采用中间件的方式还是HTTP的方式,采集的对象包括什么,以哪类信息为主,数据采集的时间周期是什么,数据的采集能否满足扩展性、灵活性和高效性等特点。(www.daowen.com)
同时需要考虑在安全上是否有提升的空间,是否有自动上传、断点续传和在数据传输过程中能够监控等内容。
(4)数据的校验、加载方式
数据校验一般分为格式校验和逻辑校验,我们需要了解格式校验的方式是什么,逻辑校验的规则有哪些等。对于数据加载来说,是否可以处理批量的加载和校验,是否能够在灵活性、扩展性和高效性上有提升的空间。
(5)数据、产品的整合和加工
我们需要了解数据整合、加工的粒度是多少,是否可以进行身份识别、疑似归并和对主数据的加工等方面。
例如,人员身份信息是以什么方式进行整合的,是否能满足对于同一个人、不同证件信息的整合和加工。对于产品加工来说,我们需要了解产品类型有哪些,是否存在“因事设库”的情况,对于相同的业务需求,是否存在重复抽取、重复加工的过程。在公共加工方面,是否有统一的规划、是否有提升的空间等内容。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。