理论教育 统计学:区间估计农业居民收入

统计学:区间估计农业居民收入

时间:2023-08-04 理论教育 版权反馈
【摘要】:区间估计是抽样估计的主要方法。要求以95.45%的把握程度估计该地区农业居民的年平均每户纯收入及纯收入总额;年平均纯收入低于5 000 元的比重及总户数。

统计学:区间估计农业居民收入

1.区间估计的含义

区间估计就是根据样本指标和抽样极限误差以一定可靠程度推断总体指标的可能范围。区间估计不是指出被估计总体指标的确切数值,而是指出它的可能范围。这种估计方法不仅以样本指标为依据,而且考虑了抽样误差的大小,并能指出总体指标在其区间范围内的把握程度。区间估计是抽样估计的主要方法。由前面的讨论,总体平均指标和成数P 的估计区间分别为:

其相应的总体总量或总体标志总量XN 及PN 的估计区间分别为:

2.区间估计的方法

在进行区间估计的时候,根据所给定条件的不同,总体平均数和总体成数的估计有两套模式,下面分别举例说明。

(1)根据已给定的置信度,求抽样极限误差。具体步骤:首先抽取样本;然后计算样本指标,即计算样本平均数和抽样成数P,作为总体指标的估计值,并计算样本标准差s以推算抽样平均误差;再根据给定的置信度F(t)的要求,查正态分布概率表求得概率度t值,根据概率度t 和抽样平均误差μ 推算抽样极限误差Δ,并根据抽样极限误差求出被估计总体指标的上限和下限,得出估计区间。

【例5-7】 现用表5-2 资料,以95.45%(t=2)的概率保证程度估计,在重复抽样和不重复抽样情况下,该地职工平均工龄和工龄在30 年以下的职工比重。

表5-2 某地10 000 职工抽样调查资料

续表

解:1.该地职工平均工龄估计(推断)。由表5-2 抽样资料可计算:

(4)根据要求以及95.45%(t=2)的概率保证程度估计,查“正态分布概率表”得t=2。

(5)计算抽样平均工龄极限误差:

(6)平均工龄区间估计(推断):

重复抽样时:

不重复抽样时:

所以,在重复抽样时,该地职工平均工龄在[11.256 年,14.744 年]的概率保证程度为95.45%;在不重复抽样时,该地职工平均工龄在[11.264 年,14.736 年]的概率保证程度为95.45%。

由上计算可知,在样本单位数远小于总体单位时,重复抽样与不重复抽样这两种抽样方式的抽样平均误差和抽样极限误差基本一致。

2.该地工龄在30 年以下的职工比例估计(推断)。由表5-2 资料计算样本指标:

(4)根据要求以及95.45%(t=2)的概率保证程度估计,查“正态分布概率表”得t=2。

(5)计算30 年工龄以下的职工比重极限误差:

(6)推断30 年工龄以下的职工比重区间:(www.daowen.com)

30 年工龄以下的职工比重下限为P-Δp=95%-4.36%=90.64%

30 年工龄以下的职工比重上限为P +Δp=95% +4.36%=99.36%

30 年工龄以下的职工比重区间[90.64%,99.36%]

所以,估计该地30 年工龄以下的职工比重区间[90.64%,99.36%]的概率保证程度为95.45%。

(2)根据已给定的抽样误差范围,求概率保证程度。具体步骤:第一步,抽取样本,计算样本指标,即计算样本平均数和抽样成数p,作为总体指标的估计值,并计算样本标准差s 以推算抽样平均差。

第二步,根据给定的抽样极限误差范围,估计总体指标的上限和下限。

第三步,将抽样极限误差除以抽样平均误差,求出概率度t,再根据t 值查“正态分布概率表”,求出相应的概率保证程度。

【例5-8】 若【例5-7】 中要求估计平均工龄误差不超过2 年和工龄低于30 年的职工比例误差小于3%,求其概率保证程度。

解:

1.估计平均工龄误差不超过2 年,其概率保证程度。

第一步和第二步与【例5-7】 中相同,不再重复。

计算平均工龄不超过2 年时的概率度t:

查“正态分布概率表”求出相应的概率保证程度为97.86%。

2.工龄低于30 年的职工比例误差小于3%,求其概率保证程度。

第一步和第二步与【例5-7】 中相同,不再重复。

查“正态分布概率表”求出相应的概率保证程度为83.24%。

【例5-9】 某地区农业居民共100 万户,按不重复方式随机抽取2 000 户调查,得其年平均纯收入为6 550 元,年平均收入的标准差为500 元;年平均纯收入低于5 000 元的比重为20%。要求以95.45%的把握程度估计该地区农业居民的年平均每户纯收入及纯收入总额;年平均纯收入低于5 000 元的比重及总户数。

则该地农业居民年平均收入在6 627.66(元)至6 672.34(元)之间、总收入在662 766(万元)至667 234(万元)之间概率保证程度为95.45%。

(2)年平均纯收入低于5 000 元户数的比重及总户数推断。

抽样平均误差

推断极限误差Δp=tμp=2 ×0.89%=1.78%

年纯收入低于5 000 元户数的比重下限为p-Δp=20%-1.78%=18.22%

年纯收入低于5 000 元户数的比重上限为p +Δp=20% +1.78%=21.78%

年纯收入低于5 000 元总户数的下限(p-Δp)N=18.22% ×100=18.22(万户)

年纯收入低于5 000 元总户数的上限(p +Δp)N=21.78% ×100=21.78(万户)

则该地农业居民年纯收入低于5 000 元户数的比重在18.22%至21.78%之间、总户数在18.22(万户)至21.78(万户)之间概率保证程度为95.45%。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈