1.数据的筛选和排序
(1)数据筛选
在对统计数据进行整理时,首先需要进行审核,以保证数据的质量。对审核中发现的错误应尽可能予以纠正。如果对发现的错误无法纠正,或者有些数据不符合调查的要求而又无法弥补,就要对数据进行筛选。
数据筛选有两方面内容:一是将某些不符合要求的数据或有明显错误的数据予以剔除;二是将符合某种特定条件的数据筛选出来,并将不符合特定条件的数据予以剔除。数据筛选可借助计算机自动完成。
【例9-1】图9-5所示为8名学生4门课程的考试成绩(单位:分)。试找出统计学成绩等于75分的学生、英语成绩排在前3名的学生、4门课程的成绩都高于70分的学生。
图9-5 8名学生4门课程的考试成绩
首先,单击“数据”菜单下的“筛选”命令。如果要筛选出满足给定条件的数据,则可使用“自动筛选”命令,如图9-6所示。
图9-6 “自动筛选”命令
单击“自动筛选”命令,这时会在第一行出现下拉箭头,用鼠标右键单击下拉箭头会出现图9-7所示界面。
图9-7 自动筛选统计学成绩等于75分的学生
若要筛选统计学成绩等于75分的学生,则可选择“75”,即得到结果,如图9-8所示。
图9-8 自动筛选结果(统计学成绩等于75分)
若要筛选英语成绩排在前3名的学生,则可选择“前10个”,并在对话框中输入数据“3”,得到结果,如图9-9所示。
图9-9 自动筛选结果(英语成绩排在前3名的学生)
如果要筛选4门课程的成绩都高于70分的学生,则需要使用“高级筛选”命令,因为设定的条件比较多。使用“高级筛选”命令时,必须建立条件区域。这时需要在数据清单上面至少留出3行作为条件区域,然后把数据清单中含有筛选值的数据列复制、粘贴到条件区域的一个空行,再在条件标志下面的一行中输入要匹配的条件,如图9-10所示。
图9-10 高级筛选条件的输入界面
然后,在“高级筛选”对话框中修改“列表区域”或“条件区域”,结果如图9-11所示。
图9-11 “高级筛选”对话框
单击“确定”按钮后,出现如图9-12所示的结果。
图9-12 高级筛选结果
(2)数据排序
数据排序就是按一定顺序将数据排列,其目的是便于研究者通过浏览数据发现一些明显的特征或趋势,找到解决问题的线索。排序还有助于对数据检查、纠错,为重新分组或归类提供依据。在某些场合,排序本身就是分析的目的之一。
对于名义级数据,如果是字母型数据,则排序有升序与降序之分,升序更常见些,因为升序跟字母的自然排列相同;如果是汉字型数据,则有很多排列方式。例如,按汉字的首位拼音字母排列,这与字母型数据的排序完全一样;也可按笔画顺序进行排序,其中也有笔画多少的升序与降序之分。交替运用不同的方式排序,在汉字型数据的检查、纠错中十分有用。区间数据和比数据的排序只有两种,即递增和递减。排序后的数据也称为顺序统计量。无论是定性数据还是定量数据,其排序均可借助计算机完成。
【例9-2】有一张由8名学生的学习成绩构成的数据清单(单位:分),如图9-13所示。试根据总成绩的递增顺序按列排序。
图9-13 学习成绩数据清单
所谓按列排序,就是根据一列或几列中的数据清单进行排序。排序时,Excel将按指定字段的值和指定的“升序”或“降序”排序次序重新设定行。
1)单击数据区域内的任意一个单元格。
2)选取“数据”菜单中的“排序”命令,出现“排序”对话框,如图9-14所示。
图9-14 “排序”对话框
3)在“排序”对话框中,单击“主要关键字”右边的下拉列表按钮,在下拉列表中选取主要关键字段,如“总成绩”,如图9-15所示。
图9-15 “排序”对话框(按总成绩)
4)指定“升序”或“降序”(此例中为“升序”)。单击“主要关键字”右边的“升序”单选按钮。
5)还可以用同样的方法选择“次要关键字”“第三关键字”以及“升序”或“降序”。
6)排除字段名行。因为字段名行不参加排序,所以如果数据清单中含有字段名行,则应单击“有标题行”单选按钮将其排除,否则单击“无标题行”单选按钮。
7)单击“确定”按钮执行排序。记录的行序被重新组织,总成绩最低的学生被排在第一个,如图9-16所示。
当对数据清单按列进行排序且只有一个排序关键字时,可以直接使用工具栏中的“升序”或“降序”按钮来完成排序,如图9-17所示。
1)单击排序字段中的任意一个单元格。
2)单击工具栏中的“升序”或“降序”按钮。通常情况下,Excel是按列排序的,但也可以按行排序。所谓按行排序,就是根据一行或几行中的数据清单进行排序。排序时,Excel将按指定行的值和指定的“升序”或“降序”排序次序重新设定列。
图9-16 按“总成绩”排序的成绩单
图9-17 “升序”或“降序”按钮
1)单击数据区域内的任意一个单元格。
2)选取“数据”菜单中的“排序”命令,出现“排序”对话框。(www.daowen.com)
3)单击该对话框中的“选项”按钮,出现“排序选项”对话框,如图9-18所示。
图9-18 “排序选项”对话框
4)在“排序选项”对话框中的“方向”列表下,单击“按行排序”单选按钮。
5)单击“确定”按钮。
余下步骤与按列排序的步骤相同。
2.利用直方图制作频率分布表
在给定数据单元格区域和接收区间的情况下,计算数据的个别频率和累积频率,用于统计有限集中某个数值元素的出现次数。例如,在一个有20名学生的班级里,可以确定以字母打分(如A、B-等)所得分数的分布情况。直方图表会给出字母得分的边界以及在最低边界与当前边界之间某一得分出现的次数。出现频率最多的某个得分即数据组中的众数。
1)“直方图”对话框,如图9-19所示。
图9-19 “直方图”对话框
2)“接收区域”编辑框(可选)。在此输入接收区域的单元格引用,该区域应包含一组可选的用来定义接收区间的边界值。这些值应当按升序排列。只要这些值存在,Excel就会统计在当前边界点和相邻的高值边界点之间的数据点个数。如果某个数值等于或小于某个边界值,则该值将被归到以该边界值为上限的区间中。所有小于第一个边界值的数值将一同计数,同样所有大于最后一个边界值的数值也将一同记数。如果省略此处的接收区域,则Excel将在数据组的最小值和最大值之间创建一组平滑分布的接收区间。
3)“柏拉图”复选框。选中此复选框,可以在输出表中同时按降序排列频率数据。如果此复选框被清除,则Excel将只按升序来排列数据,即省略输出表中最右边的三列数据。
4)“累积百分率”复选框。选中此复选框,可以在输出表中添加一列累积百分比数值,并同时在直方图中添加累积百分比折线。如果清除此选项,则会省略累积百分比。
5)“图表输出”复选框。选中此复选框,可以在输出表中同时生成一个嵌入式直方图。
【例9-3】学生历次考试成绩统计。按照一定区间生成频率分布表,使用“直方图”分析工具来完成(数据文件名:直方图.xls)。
1)打开数据文件“直方图.xls”,如图9-20所示。
2)选择“数据分析”对话框中的“直方图”选项,弹出“直方图”对话框,如图9-21所示。
3)在“输入区域”对应编辑框输入学生成绩数据的引用“$B$2:$F$15”。
4)在“接收区域”对应编辑框输入数据划分单元格的引用“$A$18:$A$22”。
5)查看是否在输入栏里选择了“标志”复选框(在此,考虑选定“标志”复选框)。在输出选项中选择“新工作表组”单选按钮,在其对应编辑框中输入输出工作表名称,如“图表输出”。选择“柏拉图”复选框、“累积百分率”复选框、“图表输出”复选框,如图9-22所示。
图9-20 直方图.xls
图9-21 “直方图”对话框(1)
图9-22 “直方图”对话框(2)
6)单击“确定”按钮,输出结果如图9-23所示。
图9-23 【例9-3】输出结果
在图9-23所示的统计结果中,可以看到输出的内容分为两部分:一部分是数据形式;另一部分是直方图形式。在数据部分,显示每个区间中的人数及累计百分率数值。由统计结果可知,在第一次考试中有6人的成绩在100~85分,5人的成绩在85~75分,1人的成绩在75~65分,1人的成绩在65分以下。
3.数据透视表
假设已经建立了一张统计表,若要建立一个交叉式的复合分组统计表,则可以使用“数据透视表”功能,如图9-24所示。
图9-24 “数据透视表和数据透视图向导”对话框
打开数据透视表和数据透视图向导后,选择待分析数据的数据源及要创建的报表类型,然后单击“下一步”按钮,选择数据区域,再单击“下一步”按钮,选择数据透视表的保存位置,最后单击“完成”按钮。
【9-4】假设已经建立了一张某单位部分人事统计表,试利用数据透视表,按性别统计各职称的基本工资总额(数据文件名:数据透视表.xls)。
1)打开数据“数据透视表.xls”,如图9-25所示。
2)单击“数据”菜单选择“数据透视表和数据透视图”命令进入“数据透视表和数据透视图向导”界面,选择创建的报表类型为“数据透视表”。
图9-25 “数据透视表.xls”
3)单击“下一步”按钮,输入或选定建立数据透视表的数据源区域,如图9-26所示。
图9-26 “数据透视表和数据透视图向导—3步骤之2”对话框
4)单击“下一步”按钮,在“数据透视表显示位置”列表下选择“新建工作表”单选按钮,如图9-27所示。
图9-27 “数据透视表和数据透视图向导—3步骤之3”对话框
5)单击“完成”按钮,则会在新建工作表中生成“数据透视表字段列表”,如图9-28所示。
图9-28 生成“数据透视表字段列表”
6)将“职称”拖至行字段处,将“性别”拖至列字段处,将“基本工资”拖至数据项处,即得到所需数据透视表,如图9-29所示。
图9-29 数据透视表
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。