理论教育 数据覆盖性和一致性在工业信息资源开发利用战略中的重要性

数据覆盖性和一致性在工业信息资源开发利用战略中的重要性

时间:2023-11-27 理论教育 版权反馈
【摘要】:1)数据覆盖性数据覆盖性将工业对象资源作为一个整体,衡量其可用性和全面性,是一种规模性测度。覆盖性、易用性和可维护性之间也存在一定的联系。评估需要提供保障的数据总量。一致性概念内涵丰富,包括来自不同数据集的两个数值的非冲突性,或在预定义的一系列约束条件内,定义的一致性等。可将一致性约束作为一系列定义一致性关系的规则,这些规则可用于属性值之间、记录或消息之间或某一属性的全部信息内容之间。

数据覆盖性和一致性在工业信息资源开发利用战略中的重要性

1)数据覆盖性

数据覆盖性(Data Coverage)将工业对象资源作为一个整体,衡量其可用性和全面性,是一种规模性测度。覆盖性、易用性和可维护性之间也存在一定的联系。由于该指标要考虑各方利益,故其与作用对象的范围,与实施质量控制的成本相关。如对任何质量监控对象,对其特征属性的普查就比抽查的成本与工作量大得多;全部质量指标的全程监控就比对关键性质量指标按某种时序模型监控的开销大得多。覆盖,原指对应用中采集资源百分比的评估,通常要作如下评估:

(1)业务对象涉及的数据范围和目标。

(2)评估需要提供保障的数据总量。

(3)分析总体资源规模。

(4)计算资源覆盖面。

这几点因素,对评估国家级的工业信息资源体系至关重要,因其涉及的工作量、成本、时间和管理难度等均随系统规模的增长而呈几何级数,甚至指数级数增加。故设计者应慎重权衡此类指标保证的范围、流程与覆盖对象,要对成本与风险之间进行平衡测算。

2)一致性

一致性(Consistency)指一个工业资源集的内容与另一个资源集内容等价性的测度。当一致性表现为使不同存储地的资源等价过程时,它就体现为资源同步,即“使数据相等的过程”(Larry English,2010)。一致性概念内涵丰富,包括来自不同数据集的两个数值的非冲突性,或在预定义的一系列约束条件内,定义的一致性等。可将一致性约束作为一系列定义一致性关系的规则,这些规则可用于属性值之间、记录或消息之间或某一属性的全部信息内容之间。(www.daowen.com)

一致性可定义同一记录中的一个属性值集与另一个属性值集之间(记录级)的一致性;或定义不同记录中的一个属性值集与另一个属性值集之间(跨记录间)的一致性;还可定义同一记录在不同时间点、不同系统间的同一属性值集之间(跨时间与地域)的一致性,等等。

国家工业信息资源体系中,需要评估在各种数据库、应用系统、业务流程及其他环境中信息存储与使用时,信息生命周期中同一信息资源的一致性。评估通常用以下方法来确定。

(1)确定冗余数据存储的数据库——定义各类资源的生命周期,确定存储数据的位置。

(2)对每个相关字段,标识其所在的资源库位置。

①从第一个数据库中抽取数据,并从每个冗余库中选择相应记录进行比对。

②将每个冗余库中的数据与原始库中的数据进行比较,确定是否有一个数据库中的数据被视为权威参考资源。

(3)分析并显示一致性验证结果,列出所有不一致资源所在的数据库及其中的记录。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈