在抽样法的实施中,样本容量的大小直接影响着样本统计量对总体被估计参数的代表性。在总体变异程度一定的条件下,样本容量n 越大,样本统计量的代表性越强。但是样本容量n 太大,又体现不了抽样法节省人力、物力、财力和时间的优越性。因此,在抽样设计时,必须确定必要的样本容量。所谓必要的样本容量,是指既能保证样本资料的代表性,又能实现最大经济效益(节约费用和时间)的样本单位数。
样本容量n 的大小受四方面因素的影响:①总体各单位某标志值的差异程度;②抽样允许误差;③抽样估计的置信度;④抽样方法。在抽样法的实施中,我们可根据抽样估计的允许误差范围与置信度要求及抽样方法来确定样本容量n 的大小。
在重复抽样条件下,用样本平均数估计总体平均数时,样本容量n 的大小按下式计算确定:
用样本成数估计总体成数时,样本容量的大小按下式计算确定:
在不重复抽样条件下,用样本平均数估计总体平均数时,样本容量n 的大小按下式计算确定:
用样本成数估计总体成数时,n 按下式计算确定:
上述算式中,t 为概率度,是标准正态分布的上分位数,可根据抽样估计的置信概率查表求得;有关的总体方差资料可以根据以往的全面调查资料加以核算;在缺乏全面调查资料时,可以用以往的样本资料代替或进行试验性抽样计算出的样本方差代替。(www.daowen.com)
从以上公式可以看出,当研究对象确定以后,总体方差是确定的数值,在此条件和抽样方法一定的条件下,影响必要的样本单位数的主要因素就是抽样的允许误差限和抽样估计的置信度。即必要的样本单位数n 与抽样的允许误差限Δ 成反比例关系,与抽样估计的置信度成正比例关系。在其他条件均不变时,如果要求抽样估计的误差越小,即抽样极限误差越小,则样本单位数就相应地要求越多。以重复抽样来说,在其他条件不变时,当误差范围缩小0.5 时,样本单位数必须增至4 倍;而允许误差范围扩大1 倍,样本单位数仅需原来的。所以在组织抽样时,对抽样误差的允许范围要慎重考虑。
在抽样调查实践中,往往要从一个样本中调查多方面的情况。例如,我国城市职工家庭调查中,既要调查职工家庭年户均收入,也要调查其消费构成。也就是说,既要通过样本资料估计总体平均数,也要通过同一样本的有关资料估计总体成数。在这种情况下,所研究的标志不同,标志值的变异程度就可能不同,因而对抽样估计的允许误差限自然会有不同的要求,导致计算所得的必要的样本单位数不同。为了确保抽样误差控制在允许的范围内,就应采用样本单位数多的设计方案。
【例6-13】 某市职工家庭调查的历史资料表明,该市职工家庭年均收入的标准差为850元,家庭消费的恩格尔系数(即家庭食品支出占消费总支出的比重)为57%。采用简单重复抽样方法对该市职工家庭本年的年均收入和恩格尔系数进行估计,要求在95.45%的概率保证下,家庭年均收入的极限误差不超过68 元,恩格尔系数的极限误差不超过4%,求必要的样本单位数n。
在为了估计全市职工家庭年均收入时,必要的样本容量为
在为了估计恩格尔系数时,必要的样本容量为计算结果取整数,应抽613 户。
由于两项调查结果要取自一个样本,所以应抽取625 户。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。