平均指标按照计算方法的不同,数据分布特征集中趋势的测度指标可分为两大类:数值平均数和位置平均数。数值平均数是根据总体各单位的各个标志值计算得到的代表值,主要有算术平均数、调和平均数和几何平均数;位置平均数是根据标志值在分布数列中的位置计算得到的代表值,主要有众数和中位数。
(一)算术平均数
1.算术平均数的概念
算术平均值亦称均值,代表一组数据的平均水平,是平均指标中最常用的测度值。算术平均数的基本形式是用总体标志总量除以总体单位数,其计算公式:
【例4-7】某企业2012年6月职工平均人数为182人,其工资总额为591500元。则该企业职工月平均工资为:
在计算算术平均数时,分子与分母必须属于同一总体,具有一一对应的关系。只有这样,计算出来的平均指标才能表明总体的一般水平。正是在这一点上,平均指标与强度相对指标表现出性质上的差异。算术平均数有简单算术平均数和加权算术平均数两种形式,下面分别加以叙述。
2.算术平均数的计算
根据所掌握的资料不同,计算算术平均数的具体方法和形式也有所不同,具体可分为简单算术平均数和加权算术平均数。
(1)简单算术平均数。将总体各单位的标志值简单加总求和,除以总体单位数所得结果称为简单算术平均数。主要适用于没有分组的原始资料或在变量数列中各组次数均相等的情况。公式如下:
式中,代表平均数;X代表标志值;∑是总和符号;N代表标志值个数。
【例4-8】某超市有8个收银员,10月1日每人收银依次为:4575元、4817元、5132元、5002元、4391元、5711元、5931元、4134元,试计算该超市10月1日平均每人收银额。
(2)加权算术平均数。原始资料经过分组,编成分配数列,将各组标志值乘以相应的次数,然后加总求和,再除以总次数,所得结果为加权算术平均数。用公式表示如下:
式中,X代表各组标志值;F代表各组单位数。
【例4-9】某车间各组有关产量和工人人数资料如表4-3所示,试计算其平均日产量。
表4-3 某车间某月产量情况
则平均日产量为:
从计算过程可以看出,平均每个工人的日产量不仅受到各组产量(X)大小的影响,而且也受各组工人人数(F)多少的影响。人数多的组,其变量值对平均数的影响大;人数少的组,其变量值对平均数的影响小。也就是说,当标志值比较大的组次数(F)多时,平均数
就接近大的一方;当标志值比较小的组次数(F)多时,平均数
就接近小的一方。标志值次数(F)多少对平均数
的影响有权衡轻重的作用。因此,在统计中常把各组单位数称为权数,把这个变量值乘以权数的过程叫加权过程,这样计算出来的算术平均数叫做加权算术平均数。由此可见,加权算术平均数的大小,受总体各单位标志值(X)的大小和各组次数(F)的多少这两个因素影响。
需要指出的是,权数对平均数的影响作用,就其实质而言,不取决于各组单位数(次数或频数)的大小,而取决于各组单位数(次数或频数)占总体单位数的比重(又叫权数系数)的大小。哪一组单位数所占比重大,哪一组标志值对平均数的影响就大。因此,当各组的单位数相等时,各组单位数所占比重相等,权数的作用相等,权数权衡轻重的作用便消失,加权算术平均数就变成简单算术平均数。这是因为当F1=F2=…=FK时,
由此可见,简单算术平均数实际上是加权算术平均数的一种特例。
由于加权算术平均数的公式可以写成
,所以,权数有两种表现形式:绝对数权数(F)和比重权数
比重权数是根据绝对权数计算而来的,权数的权衡作用就体现在比重或权数系数的大小上。由此,加权算术平均数的计算方法可以通过另外一种形式表现出来,即:
例如,仍用表4-3中的资料,以比重作权数,计算加权算术平均数(见表4-4)。
表4-4 以比重为权数求平均数计算表
则平均日产量为:
以比重为权数计算的结果与用绝对数计算的结果完全一样。上面例题用的是单项变量数列的资料。如果掌握的是组距数列资料,计算算术平均数的方法与上述方法基本相同,不同的是以组中值作变量值。
【例4-10】某企业职工的工资水平分组资料如表4-5所示。试计算该企业职工的平均工资。
表4-5 根据组距数列求平均数计算表
该企业职工的平均工资为:
利用组中值计算算术平均数,是假定各组内的变量值是均匀分布的。实际上,变量值不一定是均匀分布的,因而计算结果可能会有一些偏差。确切地说,它是一个近似值。
如果总体中包含大量的总体单位,则一般要按照某一标志进行分组,形成分组数列。在这种情况下,计算平均数时,就要采用加权算术平均数。
(二)调和平均数
调和平均数又称“倒数平均数”,是变量值倒数的算术平均数的倒数。根据所掌握的资料不同,调和平均数也有简单调和平均数和加权调和平均数两种。
1.简单调和平均数
如果掌握的资料是未分组的资料,则用简单调和平均数计算平均指标。其计算公式为:
式中,H代表调和平均数,N代表被平均的标志值项数,X代表各标志值(变量值),∑是总和符号。
【例4-11】某市场上某种蔬菜价格早、中、晚分别为每千克1.90元、1.70元、1.50元,若早、中、晚各买一千克,其平均价格是多少?若单价不变,早、中、晚各买一元钱的蔬菜,其平均价格又为多少?
很显然,在第一种情况下,应用简单算术平均数计算平均价格。
在第二种情况下,平均价格就不能再用简单算术平均数了。
购买金额为3元,购买量
早上为千克,
中午为千克,
晚上为千克。
所以,平均价格=
这就是以调和平均数计算的平均价格。
2.加权调和平均数
在分组资料情况下,如果掌握的资料是各组的变量值和标志总量,而未掌握各组单位数,则用加权调和平均数计算平均指标。其计算公式为:
式中,M代表各组标志总量,其余符号与前相同。
【例4-12】某食堂购进某种蔬菜,相关资料如下表4-6所示,求这种蔬菜的平均价格。
表4-6 某种蔬菜价格资料及其计算表
根据上表计算食堂购进这种蔬菜的平均价格为:
通过上例计算,可以看出,加权调和平均数实质上是加权算术平均数的一种变形。其变换形式如下:
上式表示,加权算术平均数以各组单位数(F)为权数,加权调和平均数以各组标志总量(M)为权数,当计算内容和结果都是相同时,作为算术平均数变形的加权调和平均数,一般运用于没有直接提供被平均标志值的单位数的场合计算,以下举例说明。
【例4-13】某厂收购某农产品为原料的收购价及计算平均收购价格如下表4-7所示:
表4-7 某农产品的收购价和收购额资料
平均收购价
这里,相应的单位数——收购数没有直接给定,只能采取收购价倒数与收购金额总额相乘得出收购量,按调和平均数方法计算。
上例说明,根据相对数或平均数来计算平均数所掌握的权数是相对数或平均数的子项数据时,应采用调和平均数计算;所掌握的权数是相对数或平均数的母项数据时,应采用算术平均数计算。
可以想象,在运用调和平均数时,如果所有的标志值的权数都相等,就可以采用简单调和平均数代替加权调和平均数:
即当M1=M2=…=MK
式中:N为被平均的标志值项数。
(三)几何平均数
1.几何平均数的概念
几何平均数是N个变量值连乘积开N次方的算术根。几何平均数适用于特殊数列的平均数,一般用于计算现象的平均比率或者平均速度。利用几何平均数计算平均比率或平均速度需满足两个前提条件:一是所掌握的变量值是比率形式,而且各个比率的连乘积等于总比率;二是相乘的各个比率或速度不得为0或负值。
几何平均数根据资料情况,可分简单几何平均数和加权几何平均数两种。前者适用于未分组资料,后者适用于分组后的变量数列。但常用的是简单几何平均数。(www.daowen.com)
2.简单几何平均数
简单几何平均数是N个变量值(比率)连乘积的开N次方根,计算公式为:
【例4-14】某汽车厂生产的机床要经过四个连续作业车间才能完成。2012年一季度第一车间铸造产品的合格率为95%,第二车间粗加工产品的合格率为93%,第三车间精加工产品的合格率为91%,第四车间组装的合格率为89%,求该企业四个车间的平均产品合格率?
解:
3.加权几何平均数
当计算几何平均数的每个变量值(比率)的次数不相同时,则应用加权几何平均法,其计算公式为:
【例4-15】某银行某项投资的年利率是按复利计算的,20年的利率分别是:有5年为5%,有4年为5.5%,有8年为6%,有3年为7%。则:
20年后的本利率为:
1.055×1.0554×1.068×1.073=3.087128
整个投资期内年利率为:
(四)众数
1.众数概念
众数是一个统计总体或分布数列中出现次数最多的标志值,通常用M0表示。例如,一种水果在农贸市场的实际价格可能经常变化,而它在市场上成交量最多的那个价格就是该水果价格的众数;商场出售鞋子的尺码有大有小,但是常常只有几个尺码卖得比较好,卖得最多的那个尺码就是鞋子尺码的众数。众数往往被认为是人气所在,反映中心倾向和观点。例如,电视台经常有“您最喜欢的春节晚会节目”“最受欢迎主持人”等评选。
2.众数的计算方法
根据所掌握的资料不同,众数既可以根据定性数据计算,也可以根据定量数据计算。
(1)定性数据或单项式数列确定众数。比较事物或变量出现的次数,出现次数最多的标志值就是众数。
【例4-16】设某超市某月男式运动鞋销售量资料见表4-8所示,试确定运动鞋的一般水平。
表4-8 男式运动鞋销售情况
从以上表格,可以看出40码的运动鞋销售量48件,占40%,次数最多,所以尺码的众数M0=40(码)
(2)组距数列确定众数的方法。对于定量数据中的组距式数列,众数的计算分两步做:第一,先确定众数所在的组;第二,利用下面的公式计算。其计算公式如下:
下限公式:
上限公式:
M0表示众数,LM0表示众数所在组的下限,UM0表示众数所在组的上限,Δ1表示众数所在组次数与前一组次数之差,Δ2表示众数所在组次数与后一组次数之差,dM0表示众数所在组的组距。
【例4-17】某学校某次学生的数学测试资料见表4-9所示,试确定学生考分的众数(满分150分)。
表4-9 某学校数学考分次数分布
首先确定众数组:最高次数为46,对应的分组为80~90,则80~90组就是众数所在组。
按下限公式:
或按上限公式:
计算结果表明,工人日产量众数76.89千克,无论用下限公式,还是用上限公式都可以得到相同的结果。
关于众数的说明:
第一,众数是一个统计总体中出现次数最多的变量值,所以众数不受极端值和开口组数列的影响,从而增强了对变量数列一般水平的代表性。
第二,众数既适用于定性数据,也适用于定量数据。
第三,在计算众数时,一组数据可能没有众数,也可能有好几个众数。
(五)中位数
1.中位数的概念
中位数是将总体各单位的标志值按大小顺序排列,居于中间位置的那个标志值为中位数,常用Me表示。中位数将数列分为相等的两部分,一部分的标志值小于中位数,另一部分的标志值大于中位数。在许多情况下,不易计算平均值时,可用中位数代表总体的一般水平。例如,人口年龄中位数,可表示人口总体年龄的一般水平。
2.中位数的计算方法
根据所掌握的资料不同,中位数的计算方法和形式也有所不同,具体可以分为未分组资料、单项式数列和组距式数列三种情况。
(1)由未分组资料确定中位数。先将数据从小到大顺序排列,然后找出中间位置,最后确定中位数。
如果总体单位数N是奇数,中间位置为(N+1)/2,则居于中间位置的标志值就是中位数。
【例4-18】有9个工人生产某产品的件数,按序排列如下:
20,23,26,29,30,33,35,38,41
中位数位置=(N+1)/2=(9+1)/2=5(位)
这表明第5位工人日产值30件产品为中位数。
如果总体单位数N是偶数,此时中间位置有两个,则居于中间位置的两项数值的算术平均数是中位数。
例如,有10个工人,日产量分别为
20,23,26,29,30,33,35,38,41,44
中位数位置=(n+1)/2=(10+1)/2=5.5(位)
这表明中位数是第五人至第六人的算术平均数。即
(2)分组资料中由单项式数列确定中位数。单项数列中位数的确定可以根据以下三个步骤来完成:
首先,计算
其次,计算各组的累计次数(向上累计次数或向下累计次数);
最后,在向上累计次数中从上往下找出首次大于或者等于的累计次数或者在向下累计次数中从下往上找出首次大于或者等于
的累计次数,确定中位数位置找出中位数。
【例4-19】某厂工人零件日产量情况见表4-10所示。试确定工人零件日产量的中位数。
表4-10 某厂工人日产零件中位数计算表
首次大于或等于40的累计次数是54(从向上累计看),或者首次大于或等于40的累计次数是53(从向下累计看),确定中位数所在的位置,得到中位数,即Me=58(件)。
(3)分组资料中由组距式数列确定中位数。
首先,计算
其次,计算各组的累计次数(向上累计次数或向下累计次数);
最后,在向上累计次数中从上往下找出首次大于或者等于的累计次数或者在向下累计次数中从下往上找出首次大于或者等于
的累计次数,确定中位数所在的组,利用下列计算公式算出中位数。
其计算公式如下
下限公式:
上限公式:
式中:LMe表示中位数组的下限,UMe表示中位数组的上限,FMe表示中位数组的次数,SMe-1表示中位数所在组以前各组的累计次数,SMe+1表示中位数所在组以后各组的累计次数,∑F表示总次数,dMe表示中位数所在组的组距。
【例4-20】以表4-11的资料为例做分析。
表4-11 某学校数学考分的中位计算表
,然后根据向上累计数可知65<82<111,或者根据向下累计数53<82<99,可知中位数在80~90组内。然后运用公式计算中位数。按下限公式:
按上限公式:
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。