从数据建模的角度来看,数据主题域是一个比较抽象的概念,是对业务运营或信息系统中的事实数据在一定层次上的归纳和综合,是对业务应用中某一业务领域所涉及的数据进行的一个完整、一致的描述,定义和揭示各个分析对象所涉及的业务数据及数据之间的联系。
数据域建模应从某一业务领域出发,通过梳理业务流程来识别和定义参与业务流程的核心数据实体,然后在核心业务实体的基础上进一步归纳和抽象得到一个个主题域。数据域分析过程如图6-2所示。
图6-2 主题域的分析过程与方法
核心业务实体是一个业务对象,能独立于其他业务实体存在,每个主题域是在核心业务实体上的进一步业务抽象,消除具体对象意义。企业内的数据实体是很多的,如此多的实体各有创建的业务部门,有数据的负责人和管理规则,如果不对这些数据进行分类和汇总,是难以实现科学管理的。对数据的分类有多重划分标准,数据域划分实际上就是数据分类,将梳理出来的数据实体按照一定的分类标准进行分组,以便于更好地管理和利用。
数据分类是数据架构设计的起点,而数据的种类又纷繁复杂,数据的属性或特征从不同视角来看具有不同的特点,要科学、完整地进行数据实体的梳理和分类,可以从数据的业务环节、数据的应用及数据的自身结构等维度来进行细分。
从业务角度来看,数据由各个业务环节生产和使用,具有特定的业务本质及业务相关性,确定业务本质相同或关联性相对较强的数据集边界,有利于实现数据的高内聚低耦合,也便于与应用架构建立对应关系。
从应用角度来看,对于应用系统,有些是数据的生产者,而有些则是信息的消费者,需要站在全局高度,把数据采集、存储、加工、分析、发布和废弃等各个环节进行一体化管理,把握数据分析应用的基础,它不是任何单项数据应用系统,而是一个全面、协调、持续发展的数据环境。(www.daowen.com)
从数据结构角度来看,数据可划分为结构化数据和非结构化数据两大类。对于结构化和非结构化数据,需要不同的管理和技术手段进行处理:一方面要对操作型和分析型等不同的结构化数据采取不同的处理策略;另一方面,要加强对非结构化数据的管理。
因此,在对数据进行分类时一般是从3个角度来展开的,其中业务环节是主要的分类依据。企业在进行数据域分析时重点要根据业务特点对数据进行合理的归纳和分类,汇总出数据的业务域和业务子域。
如某电信运营企业将自身的数据分为客户、市场营销、产品、服务、资源、合作伙伴、企业管理和公共等8个域,每个数据域还可以细分为若干子域,具体如图6-3所示。
数据的主题域建模是一个自顶向下和自底向上结合、反复迭代的过程,应满足以下两点要求:一是主题域的完整性,完整的主题域界定了业务对数据的需求范围,避免了核心重要数据的遗漏,使数据能支撑业务能力需要;二是主题域的独立性,主题域相对独立,能减少主题域之间的数据重叠和冗余,提高主题域模型的灵活性和可扩展性。
图6-3 某电信企业数据域与子域划分示例
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。