理论教育 检测和清洗不一致数据

检测和清洗不一致数据

时间:2023-06-07 理论教育 版权反馈
【摘要】:图5-3-2给出了不一致数据的处理流程图。图5-3-2不一致数据的处理流程图(二)数据不一致性改善在生产管理模块中的应用针对不一致的脏数据,其检测流程分为如下几个步骤:①查找出所有的不同关系表中的相同属性。表5-3-3一致性的属性对查找出的不符合一致性要求的脏数据,可以通过以下方式进行清洗:1)如果属于满足参照完整性约束的情况下,大多采取修改外键表中属性的方式,选择最相似的属性值来代替。

检测和清洗不一致数据

(一)不一致数据的处理流程

对不一致数据的处理过程如下:

1)查找出关系表中处于不同关系表中相同属性的所有情况。

2)如果属于参照完整性关系中的外键情况,检查主键表和外键表是否满足一致性约束,如果不满足,修改模式层的约束以及设置触发器

3)如果不属于上述情况,可能属于系统设计阶段为了出于系统运行效率的考虑而多设置的属性,设置其中一个被参照关系中数据为遍历表,然后检查是否参照关系中的相同属性的值是否包含在遍历表中,如果没有,需要进一步的修改。

图5-3-2给出了不一致数据的处理流程图。

978-7-111-50077-3-Chapter05-26.jpg

5-3-2 不一致数据的处理流程图

(二)数据不一致性改善在生产管理模块中的应用(www.daowen.com)

针对不一致的脏数据,其检测流程分为如下几个步骤:①查找出所有的不同关系表中的相同属性。②满足参照完整性,其中一个表为主键表,另外一个表为外键表,将外键表中的相同属性与主键表中的相同属性的值进行对比,如果外键表中的属性在主键表找不到相应的值,说明该记录不满足一致性的要求。③对于不符合参照完整性约束的,在这种情况下,在不同表单中涉及相同属性,主要是出于存储和查询效率的考虑。但是还是需要设定其中的一个被参照关系表为遍历表,并实施查询,找出不满足一致性的记录。

在生产管理系统所列举的表单中,存在着相同属性在不同表单中出现的情况,那么就需要满足一致性的要求。表5-3-3给出了需要满足一致性要求的属性。

5-3-3 一致性的属性

978-7-111-50077-3-Chapter05-27.jpg

对查找出的不符合一致性要求的脏数据,可以通过以下方式进行清洗:

1)如果属于满足参照完整性约束的情况下,大多采取修改外键表中属性的方式,选择最相似的属性值来代替。

2)有可能是在主键表中相关记录删除后,未对外键表中的相关属性进行调整修改,这时需要根据修改文件进行调整。

3)对于不符合参照完整性约束的情况,可通过遍历表中的属性值来修改被查询表中的属性值,以使其满足一致性的要求。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈