理论教育 数据规范化:提升数据质量的关键步骤

数据规范化:提升数据质量的关键步骤

时间:2023-06-09 理论教育 版权反馈
【摘要】:数据的规范主要应遵循五项要求。图1-1-13不规范的数据图1-1-14对E列数据求和时结果为03.日期的格式要规范在Excel中,输入日期时,代表年、月、日的数字之间可以用“-”或者“/”进行分隔,如“2018-3-6”或者“2018/3/6”,如果输入“2018.3.6”或者“20180306”就不符合规范。

数据规范化:提升数据质量的关键步骤

数据表中除了需要注意表格结构的规范外,还要注意数据的规范。数据的规范主要应遵循五项要求。

1.数值与单位不要放同一列

如果在数据表中同一列既包括数值又包括单位,就会导致Excel无法获取数值直接进行计算。如图1-1-13所示的表格中,E列的数据把数值和单位写在了同一列,如果对E列数据进行求和,则得到的结果为0,如图1-1-14所示。

2.不能在文本的中间添加空格

有些人在制作数据表时,为了让表格看上去更整齐,喜欢在文本的中间添加空格,这在数据表中也是不允许的。如果在文本的中间增加空格,在使用文本函数处理文本时公式会变得更复杂,增加了处理的难度。如图1-1-13所示的表格中,“姓名”一列的“周伟”中间加了空格,这也是不符合数据表数据规范的。

图1-1-13 不规范的数据

图1-1-14 对E列数据求和时结果为0(www.daowen.com)

3.日期的格式要规范

在Excel中,输入日期时,代表年、月、日的数字之间可以用“-”或者“/”进行分隔,如“2018-3-6”或者“2018/3/6”,如果输入“2018.3.6”或者“20180306”就不符合规范。如图1-1-13所示的表格中,A列的日期就无法正确排序,也无法通过日期函数提取正确的年、月、日信息,因为在常规情况下“2018.3.6”是文本型数据,而“20180306”是数值型数据。

4.计算的数值不能为文本型的数字

在Excel中,经常需要对数值进行各种计算,但是如果把需要计算的数值设置成文本型数据,则不能进行计算,特别是一些从系统导出的表格更需要注意这个问题。在图1-1-13所示的表格中,D列“单价”的数据就是文本型的数据,必须将其转换成数值型数据才能进行下一步的计算。

5.同一列数据的类型、格式要一致

在Excel中,同一列数据的类型一定要一致,否则在进行筛选或者汇总时会产生错误。如图1-1-15所示的表格中,“性别”和“出生年月”字段的数据类型就不统一,必须将同一列的数据转换成同一类型和格式才能进行下一步的数据分析。

图1-1-15 数据类型不统一

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈