数据静态分析可以从数据分布的集中趋势、数据分布的离散程度、数据分布的形状三个方面的指标进行描述和分析。
1.描述数据集中趋势的统计指标
集中趋势是指一组数据向其中心值靠拢的倾向和程度,它反映了一组数据中心点的位置所在。描述集中趋势的统计指标有算术平均数、几何平均数、调和平均数、众数、中位数等。这些统计指标的含义和计算公式如表1-6-1所示。
表1-6-1 集中趋势统计指标的含义和计算公式
注意:表1-6-1中的计算公式适用于未分组的样本数据序列。
2.描述数据离散程度的统计指标
离散程度反映了各样本值离其中心值的程度,是数据分布的另一个基本特征。离散程度从另一个角度说明了集中趋势测度值的代表程度。数据的离散程度越大,集中趋势测度值对该组数据的代表性就越差;数据的离散程度越小,集中趋势测度值的代表性就越好。度量离散程度的统计指标主要有方差、标准差和四分位差。表1-6-2列出了主要的离散程度指标的含义和计算公式。
表1-6-2 离散程度指标的含义和计算公式
注意:表1-6-2中的计算公式适用于未分组的样本数据序列。
3.描述数据分布形状的统计指标
分布形状的统计指标用于描述数据分布的形状是否对称、偏斜的程度,以及分布的扁平程度。分布形状的统计指标主要有偏度和峰度。
(1)偏度。
偏度是数据分布对称性的度量。如果一组数据的分布是对称的,则偏度为0;如果偏度大于0,表明数据分布为右偏分布;如果偏度小于0,表明数据分布为左偏分布。偏度越大,表明偏斜的程度越大。偏度的计算公式为:
(2)峰度。
峰度是数据分布平峰或尖峰程度的测度。若一组数据服从标准正态分布,则峰度值为0;若峰度值明显不等于0,则表明分布比正态分布更平坦或更尖。峰度的计算公式为:
4.Excel2013的统计指标计算函数
Excel2013提供了上述统计指标的计算函数,利用这些函数可以快速计算出相应的统计指标的值,如表1-6-3所示。
表1-6-3 Excel2013的统计指标计算函数
5.用Excel的数据分析工具进行描述统计分析
利用Excel2013的“数据分析”工具的“描述统计”功能,可以快速计算出上述各种静态描述统计指标的值。(www.daowen.com)
例6-5 以例6-2的50位学生的高等数学成绩为例,计算静态描述统计指标的值。
具体操作步骤如下。
(1)将50个学生的成绩输入到工作表的A2:A51单元格区域,参见图1-6-12中的A列。
图1-6-12 不分组数据静态描述分析的结果
(2)单击“数据”选项卡下“分析”组中的“数据分析”按钮,打开“数据分析”对话框,如图1-6-13所示;选择“描述统计”,然后单击“确定”按钮,打开“描述统计”对话框,如图1-6-14所示。
注意:如果没有显示“数据分析”工具,参考前面6.1.2小节的方法加载“数据分析”工具。
(3)在“描述统计”对话框中,设置输入区域、输出区域的值,并单击选中有关的复选按钮,参见图1-6-14。设置完参数后,单击“确定”按钮,即可得到各个描述统计指标的值,参见图1-6-12的F列和G列的值。
图1-6-13 “数据分析”对话框
图1-6-14 “描述统计”对话框
对于图1-6-12中各个统计指标,也可以用表1-6-3所列的函数进行计算。各指标的计算公式如下。
算术平均数:=AVERAGE(A2:A51);
几何平均数:=GEOMEAN(A2:A51);
调和平均数:=HARMEAN(A2:A51);
中位数:=MEDIAN(A2:A51);
众数:=MODE(A2:A51);
标准差:=STDEV(A2:A51);
方差:=VAR(A2:A51);
偏度:=SKEW(A2:A51);
峰度:=KURT(A2:A51);
四分位差:=QUARTILE.INC(A2:A51,3)-QUARTILE.INC(A2:A51,1)。
计算结果参见图1-6-12的D列内容。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。