(一)抽样方案设计的主要内容
抽样方案式指对整个抽样调查过程的具体组织实施办法,要使抽样推断工作顺利进行,需要全盘考虑,进行抽样方案设计。抽样方案设计的内容包括:
1.确定抽样调查的目的和调查项目。
2.确定调查对象(总体)。
3.确定抽样调查的组织方式和抽样方法。
4.确定抽样调查达到的可靠程度和准确性的要求。
5.确定必要的抽样数目。
6.确定抽样估计的方法。
7.确定工作机构及经费管理。
在抽样组织实施过程中要注意保证实现抽样的随机原则,保证实现最大的抽样效果。
(二)必要样本容量的计算
在抽样推断中,影响抽样误差的因素有抽样单位数n。抽样单位数越多,抽样误差越小,抽样推断越可靠。但是,抽取的样本单位数太多,会浪费大量的人力、物力和时间;抽样单位数太少,抽样误差太大,无法达到准确性和可靠性要求的目的。因此,若要控制抽样误差,保证抽样结果能达到预期目的,可以在抽样调查之前,合理地确定单位数目。
在简单随机抽样方式下,可根据抽样极限误差的公式推导出来。
在重复抽样下,必要的样本单位数为:
在不重复抽样下,则必要的样本单位数为:
同理,重复抽样和不重复抽样的成数样本单位数分别为:
上述公式计算时要注意的问题:
(1)计算时一般总体的方差σ2或P(1-P)未知,在没抽样之前也无法用样本方差s2或p(1-p)代替。一般可以前一次或用历史资料代替。如果以前没有调查资料,可事先做一些试验性的调查,用试验结果得到的方差代替。(www.daowen.com)
(2)如果方差同时有多个不同的结果,对σ2而言选择最大的一个值。对P而言选择最接近0.5的那个数值,它能使成数的方差P(1-P)为最大值,才能保证抽样调查一定的准确性。
(3)在同一调查中,平均数和成数估计所需的抽样单位数目不同时,或者有多个抽样单位数目资料时,为了保证抽样的准确性和可靠性,应该取其中较大的数值n作为共同使用的抽样单位数目。
【例5-6】以抽样调查学生生活消费支出为例,某学院有学生3500人,根据以前的调查,学生平均月生活消费支出的标准差为80元,要求抽样误差不超过30元,概率保证程度要达到99.73%,那么,应抽取多少个样本单位为宜?
重复抽样,平均数抽样单位数目为:
不重复抽样,平均数抽样单位数目为:
【例5-7】仍以上述调查学生生活消费为例,若根据以前调查,学生月生活消费在300元以下人数占29%,要求允许误差不超过15%,概率保证程度要达到99.73%应抽取多少个单位数目?
解:已知p=29%,Δp=15%,t=3。由p(1-p)=0.29×0.71=0.2059
重复抽样,成数的抽样单位数目为:
不重复抽样,成数的抽样单位数目为:
根据以上计算可知,要达到以上要求,估计学生月平均消费支出和生活消费在300元以下人数比重,至少应抽取样本单位数目为83人。
从以上计算可知,影响抽样单位数目有如下几个因素:
(1)t值的大小,即可靠性的大小。t值大,可靠性F(t)高,就需要多抽;反之,就可以少抽。
(2)Δx-或Δp值的大小,即准确性的大小。准确性高(允许误差范围小)需要多抽;反之,就可以少抽。
(3)σ2或P(1-P)值的大小,即总体变量值差异程度的大小。在准确性和可靠性一定的情况下,差异程度大需要多抽;反之,就可以少抽。
(4)抽样方法的不同。要达到一定准确性和可靠性的情况下,一般重复抽样需要多抽,不重复抽样可以少抽。
在其他条件不变的情况下,如果允许误差变动为原来k倍时,抽样单位数目为所以,在实际抽样中,要改变抽样的准确性(允许误差范围),就可大致知道应抽选多少样本单位数目,才能达到预期的目的。特别是抽样准确性不是要求很高时,可以减少许多人力、物力和工作量的投入。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。