理论教育 抽样估计茶叶出口质量合格率的上下限

抽样估计茶叶出口质量合格率的上下限

更新时间:2025-01-03 理论教育 版权反馈
【摘要】:表6-4某外贸公司出口茶叶抽样资料第一步,根据样本资料计算样本平均数和标准差,并推算抽样平均误差。第三步,根据概率度和抽样平均误差计算抽样极限误差,并估计总体合格率的上、下限。要求抽样极限误差范围不超过2.73%,试对该市居民户拥有独立厨卫设施的比例进行估计。

抽样估计就是利用实际调查计算的样本指标值来估计相应的总体指标值,即对总体平均数img 和总体成数P的推断估计。由于总体指标是表明总体数量特征的参数,因此也称参数估计。总体参数估计有点估计和区间估计两种。

1.点估计

点估计又称定值估计,它是将样本计算出的统计量直接作为总体参数的估计量。如将样本平均数的实际值作为总体平均数的估计量;将样本成数的实际值作为总体成数的估计值。

例如,抽选6 000名大学生进行月消费支出调查,结果表明这6 000名大学生的月平均消费支出为1 080元。此时,我们会推断说,全体大学生的月消费支出为1 080元;又如,某企业从10 000台微波炉中随机抽取3%进行质量检查,结果合格率为98%,则据此推断10 000台微波炉的合格率为98%。

对总体指标进行估计时,总是希望估计是合理或优良的。那么什么是优良估计的标准呢?优良估计是从总体来评价的,有三个基本标准——无偏性、有效性和一致性。无偏性是指用样本指标估计总体指标时,要求样本指标的平均数等于被估计总体指标的平均数;有效性是指用样本指标估计总体指标时,要求样本指标的方差最小,因此,有效性也是最小方差性;一致性是指用样本指标估计总体指标时,若样本容量增加,样本指标越来越接近总体指标,则称样本指标为总体指标的一致估计量。

总体参数点估计方法的优点是简便、易行、原理直观,常为实际工作所采用。其不足之处也是显著的,即点估计没有表明抽样估计的误差,更没有指出误差在一定范围内的置信度。而区间估计能解决这一问题,所以,此时区间估计是更好的估计方法。

2.区间估计

(1)区间估计的概念

区间估计是指在抽样指标数值基础上以一定的置信度推断总体参数的可能取值区间的一种参数估计方法。区间估计结果包括两部分内容:一是总体参数的可能取值区间,称为置信区间;二是总体参数在这个区间上取值的概率,称为置信度。区间估计既表明了估计结果的准确程度,又表明了估计结果的可靠程度,所以区间估计是比较科学的参数估计方法。

区间估计用公式表示为

式中,imgimg分别是总体平均数区间的上限与下限;p+Δp和p-Δp分别为总体成数的上限与下限。img和p-Δp、p+Δp均为置信区间,表达了区间估计的精确性。与置信区间相联系的一个概念是置信度,也叫概率保证程度,用F(t)表示。置信度是指在抽样调查中,通过抽取一套样本进行调查以推断总体的平均数或成数在某个范围内的可能性有多大,也就是概率有多少。置信度与允许误差的范围密切相关。在其他条件不变的情况下,精确度要求越低(即允许误差范围越大),置信度越大,即把握程度越高;反之,精确度要求越高,把握程度越低。

科学的区间估计方法要具备三个基本要素:

1)样本指标,它是区间估计的基础。

2)抽样极限误差,用以推算总体指标值的估计区间,说明区间估计的精确度。

3)置信度可表明总体指标数值落在估计区间的可靠性大小。

以上三个要素中,区间估计的精确度和可靠性是矛盾的,提高了区间估计的精确度,必然伴随着区间估计可靠性的降低;同样提高了区间估计的可靠性,也必然伴随着区间估计精确度的降低。所以,在抽样估计时,只对其中一个要素提出要求,进而推求另一个要素的变动情况。因此,总体参数的区间估计根据给定的条件不同,有不同的估计模式。

(2)区间的估计模式

在进行区间估计时,根据所给定条件的不同,总体平均数和总体成数的估计有以下两套模式可供选择使用。

1)根据给定的抽样误差范围,估计置信度。具体步骤是:首先,抽取样本,根据样本单位标志值计算样本指标,如计算样本平均数或样本成数来作为总体指标的相应估计值,并计算样本标准差以推算抽样平均误差;其次,根据给定的抽样极限误差范围,估计总体指标(平均数或成数)的下限和上限;最后,根据给定的抽样极限误差除以抽样平均误差,求出概率度t,再根据t值查正态分布概率表,求出相应的置信度F(t),并对总体参数作区间估计。这种估计方法分为总体平均数的估计和总体成数的估计两种形式。

【例6-4】对某城市进行居民家计调查,随机抽取400户居民,调查得知户平均文化用品消费支出为900元,标准差为200元。要求抽样极限误差不超过20元,试对该市居民户年均文化用品消费支出情况做出估计。

第一步,抽取样本,计算样本平均数和标准差,并计算抽样平均误差。

已知img元,S=200元,n=400户,则

说明:本章涉及的总体标准差用样本标准差来代替。

第二步,根据给定的误差范围,计算该市居民户年均文化用品消费的范围,即

第三步,计算概率度,并查正态分布概率表,估计置信度。

查正态分布概率表得

计算结果表明,若以95.45%的置信度估计,则该市居民户年均文化用品消费支出在880~920元。

【例6-5】对某市居民户拥有独立厨卫设施情况进行调查,随机抽取900居民户,其中有675户居民拥有独立的厨卫设施。要求抽样极限误差范围不超过2.73%,试对该市居民户拥有独立厨卫设施的比例进行估计。(www.daowen.com)

第一步,抽取样本,计算样本成数和标准差,并推算抽样平均误差。

第二步,根据给定的误差范围,计算总体成数的上、下限。

第三步,计算概率度,并查正态分布概率表,估计置信度。

查正态分布概率表得

计算结果表明,以95%的置信度估计,该市居民户拥有独立厨卫设施的比例在72.27%~77.73%。

2)根据置信度的要求,估计总体指标出现的可能范围。具体步骤是:首先,抽取样本。根据样本单位标志值计算样本指标(如计算样本平均数或样本成数,以作为总体指标的相应估计值)并计算样本标准差,用以推算抽样平均误差。其次,根据给定的置信度F(t)要求,查正态分布概率表,求得概率度t。最后,根据概率度和抽样平均误差来推算抽样极限误差的可能范围,并据以计算被估计总体指标的上、下限,对总体参数作区间估计。这种估计方法也分为总体平均数的估计和总体成数的估计两种形式。

【例6-6】某外贸公司出口一种茶叶,规定每包规格不低于150克,现在用不重复抽样的方法抽取其中1%进行检验,测得的结果如表6-4所示。要求以99.73%的置信度估计这批茶叶每包的平均质量范围,以便确定平均质量是否达到规格要求。

表6-4 某外贸公司出口茶叶抽样资料

第一步,根据样本资料计算样本平均数和标准差,并推算抽样平均误差。

第二步,根据给定的置信度F(t)=0.997 3,查正态分布概率表,得概率度t=3。

第三步,根据概率度和抽样平均误差计算抽样极限误差,并估计总体平均数的上、下限,判断其是否达到规格要求。

计算结果表明,若以99.73%的置信度估计,则该批茶叶每包平均质量在150.04~150.56克,从而表明这批茶叶每包的平均质量达到了规格要求。

【例6-7】仍用上例资料,要求用同样的置信度估计这批茶叶包装的合格率范围。

第一步,根据样本资料计算样本合格率和标准差,并推算抽样平均误差。

第二步,根据给定的置信度F(t)=0.997 3,查正态分布概率表,得概率度t=3。

第三步,根据概率度和抽样平均误差计算抽样极限误差,并估计总体合格率的上、下限。

计算结果表明,若以99.73%的置信度估计,则该批茶叶包装的合格率在56.3%~83.7%。

(3)总体总量指标的推算

前面介绍了由样本平均数和样本成数推断总体平均数和总体成数的方法。此外,抽样指标还可以用来推算总体的总量指标。常用的方法有以下两种:

1)直接推算法。直接推算法是用样本指标值或总量指标(总体平均数和总体成数)的区间估计值乘以总体单位数来推算总体总量指标的方法。样本指标乘以总体单位数,即img和pN就是总体总量指标的点估计值;总体指标的区间估计值乘以总体单位数,即imgN、img和(p-Δp)N、(p+Δp)N是总体总量指标的区间估计值。

【例6-8】对5 000个零件进行抽样调查,抽样结果表明:废品率为1.5%,抽样误差为0.5%。有95%的置信度可以保证废品率为0.52%~2.48%。即这5 000个零件中,废品总量应为26(5 000×0.52%=26)~124(5 000×2.48%=124)件。

如果不考虑抽样误差,则可直接推算全部零件的废品总数量约为75(5 000×1.5%=75)件。

2)修正系数法。修正系数法是先将抽样调查与全面调查资料对比计算差错比率,即修正系数,然后用差错比率修正全面调查结果。因此,修正系数法是用抽样调查结果修正全面调查结果的方法。

修正系数法的计算步骤为:

①修正差错比率:

②用差错比率修正全面调查结果:

修正以后全面调查数=全面调查数×(1+差错比率)

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈