理论教育 统计学:测定标志变异指标

统计学:测定标志变异指标

时间:2023-07-29 理论教育 版权反馈
【摘要】:如果统计的目的仅是观察、控制标志值变动范围,那么全距是比较适用的指标。此外,标准差的计算应用了最小平方法原理,以算术平均数为中心,使标准差成为反映标志变异的最佳指标,在风险的衡量和统计分析中应用最为广泛。这是因为全距、平均差、标准差都是反映总体各单位标志值变异的绝对指标,其数值大小受总体单位标志值本身水平高低的影响。离散系数又称标志变异系数,是标志变异绝对值指标与相应的平均数的比值。

统计学:测定标志变异指标

测定标志变动度的指标主要有全距、平均差、方差、标准差和离散系数这五种。

(一)全距

全距是数列中最大标志值与最小标志值之差,用来说明标志变异的情况,其表达公式为

用未分组资料和单项数列计算全距,直接用最大标志值减最小标志值即可。

【例5-23】 有甲、乙两组工人,每组均为5 人,每人每月生产某种零件情况如表5-12所示。

表5-12 每人每月生产某种零件情况

由表5-12 可知,甲、乙两组的每名工人平均日产量件,但各组的差异程度大小不同。

说明甲组平均日产量代表性比乙组平均日产量代表性高。

用组距数列计算全距,直接求最高组的上限与最低组下限之差,即得全距的近似值。

全距优点在于计算简单、意义明确,是粗略测定标志变动度的简便方法。如果统计的目的仅是观察、控制标志值变动范围,那么全距是比较适用的指标。在实际工作中,全距常用于工业产品质量的检查和控制。例如,在正常生产条件下,产品质量性能指标(如温度、硬度、长度等)的差距总是在一定范围内,若情况出现异常,其差距会超出一定范围。利用全距跟踪产品质量,可及时发现问题,以便采取措施。但全距受两个极端变量值的影响,与中间的其余数值无关,更不受变量数列次数分布的影响,因而其结果具有很大的偶然性,不能全面反映各标志值的变异程度,只是一种粗略的方法。

(二)平均差

在统计研究中,把总体单位的标志值与其算术平均数之差叫离差,离差的平均数就是平均差。平均差是总体中各单位标志值与其平均数离差的绝对值的算术平均数,通常用A·D 表示。

前面已介绍,各标志值和平均数的离差之和等于零,因此,其离差平均数也等于零。为使各标志值与平均数的正负离差不致相互抵消,在计算各标志值与其算术平均数的离差时取其绝对值。平均差反映总体各单位标志值对其平均数的平均离差量,平均差越小,表明标志变异程度越小;反之,则表明标志变异程度越大。

与全距相比,平均差包括了总体中所有单位标志值的差异情况,弥补了全距测定标志变动度时只受极端变量值影响的缺点,作为反映标志值离散程度的指标较为客观。根据掌握的资料,平均差分为简单平均差与加权平均差两种形式。

1.简单平均差

在资料未分组时,用简单平均差计算,其计算公式为

式中,A·D 代表平均差;x 代表标志值;代表算术平均数;n 代表总体单位数,即项数。

【例5-24】 延用【例5-23】 资料,计算甲、乙两个小组生产零件的件数平均差。

计算结果表明,甲、乙两组工人的平均日产量相同,都是50 件;但平均差不同,甲组工人的日产量平均差为2.4 件,乙组为12 件,乙组大于甲组,说明其平均数代表性比甲组差。

2.加权平均差

在资料经过分组形成分配数列时,平均差计算采取加权的形式,其计算公式为

式中,fi代表各组次数;代表总次数。

【例5-25】 某班同学的英语考试成绩情况如表5-13 所示。

表5-13 某班同学的英语考试成绩情况

续表

注:离差=组中值-平均分=xi

计算结果说明,该班30 名学生英语考试成绩的平均差为8.89 分,即每个同学的成绩与平均成绩之间平均相差8.89 分。(www.daowen.com)

(三)方差和标准差

方差是总体各单位标志值与其算术平均数离差平方的算术平均数,用σ2表示。

标准差是离差平方的算数平均数的平方根,故又称均方根差,用σ 表示,反映各标志值对平均指标的平均离差,能准确地反映总体的离散程度。

数学处理方法上,标准差与平均差不同:标准差采用平方的方法来消除离差的正负号,然后再开方以恢复原来的计量单位;平均差用绝对值来消除离差正负相抵消的情况。此外,标准差的计算应用了最小平方法原理,以算术平均数为中心,使标准差成为反映标志变异的最佳指标,在风险的衡量和统计分析中应用最为广泛。方差和标准差的计算也分为简单式和加权式两种。

1.简单方差和标准差

在资料未分组的情况下,计算方差和标准差用简单平均的方法,其计算公式为

式中,代表离差的平方和;n 代表总体单位数。

方差、标准差越小,说明标志变异程度越小,其平均数代表性越高;方差、标准差越大,说明标志变异程度越大,其平均数代表性越低。

【例5-26】 延用【例5-23】 资料,计算甲、乙两组工人生产产品零件的方差和标准差。

甲组工人生产产品的方差和标准差分别为,则

乙组工人生产产品的方差和标准差分别为,则

计算结果说明,乙组的方差、标准差大于甲组,说明其平均数的代表性比甲组低。

2.加权方差和标准差

根据分组资料计算方差或标准差时,需要用加权平均方法来计算标准差,其计算公式为

式中,f 为各组次数;为总次数。

若已知分组资料是单项变量数列,可直接根据加权式计算方差和标准差;若已知资料是组距数列,则先要计算出各组组中值代表各组的标志值,然后按加权式计算标准差。

【例5-27】 某工业企业200 名工人的工资情况如表5-14 所示。

表5-14 某工业企业200 名工人的工资情况

注:离差=月工资额-平均工资=xi-x。

【例5-28】 延用【例5-25】 资料,计算某班同学英语考试成绩的方差和标准差。计算过程如表5-15 所示。

表5-15 方差及标准差计算

注:离差=xi-x。

(四)离散系数

全距、平均差和标准差可以反映总体单位标志值的离散程度。对于同质的总体,若平均数相同,就可以直接用全距、平均差、标准差比较,其数值越小,表示平均指标代表性越大;反之,平均指标代表性越小。但是对于不同性质的总体,其平均数不同,就不能直接用全距、平均差、标准差进行比较。这是因为全距、平均差、标准差都是反映总体各单位标志值变异的绝对指标,其数值大小受总体单位标志值本身水平高低的影响。为了消除平均水平高低的影响,以反映不同水平变量数列的变异程度,需要计算离散系数。

离散系数又称标志变异系数,是标志变异绝对值指标与相应的平均数的比值。其数值越小,说明平均数代表性越高;数值越大,说明平均指标代表性越低。离散系数指标一般用V表示,主要有全距系数、平均差系数、标准差系数,其计算公式为

离散系数以百分比表示,消除了不同总体在计量单位、平均水平上的不可比因素,可直接用于不同数列之间离散程度的对比。在实际统计分析中,最常用的是标准差系数。

【例5-29】 甲、乙两公司职工年平均收入分别为10 万元和20 万元,标准差分别为800元和1 000 元。则甲、乙两公司职工年劳动生产率的标准差系数分别为

计算结果表明,甲企业标准差系数大于乙,其平均劳动生产率代表性小于乙。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈