理论教育 统计学:抽样误差及影响因素

统计学:抽样误差及影响因素

时间:2023-07-29 理论教育 版权反馈
【摘要】:抽样误差是概率抽样所固有的、无法避免的代表性误差。在其他条件不变的情况下,抽样误差的大小与总体被研究标志的变异程度成正比。此外,抽样误差的大小还会受抽样组织方式和抽样方法的影响。这种以绝对值形式表示的抽样误差的可能范围,称为抽样极限误差或允许误差。抽样极限误差通常以抽样平均误差为标准进行确定。

统计学:抽样误差及影响因素

(一)统计误差的定义及种类

统计资料的准确性是统计的“生命”。但是,由于调查的组织技术、业务水平、思想作风、工作态度及抽样调查中用部分单位的资料估计总体等因素的影响,通过统计调查所获取的资料往往与客观实际之间存在一定差异,这种差异称为统计误差。统计误差主要有两类,一类是调查误差,另一类是代表性误差。

调查误差是在调查过程中由于观察、测量、登记、计算等方面的失误所导致的误差。

代表性误差是由抽样方法本身产生的误差。其原因来自两个方面:一方面是违反抽样的随机原则,有意识选择较好或较差的单位进行调查,或者在采用等距抽样方法时,抽取样本单位的间距正好与事物本身的周期性变化吻合,导致样本结果不能代表总特征,这种误差是系统的,也被称为系统偏差;另一方面是即使严格按照随机原则抽样,样本统计量与总体参数之间仍然存在差异,这种误差被称为抽样误差。本节主要介绍抽样误差。

(二)抽样误差的定义及影响因素

抽样误差是由随机抽样的偶然性引起的样本统计量与总体参数之间的绝对离差。例如,样本平均数与总体平均数之间的绝对离差,样本成数与总体成数之间的绝对离差等。抽样误差是概率抽样所固有的、无法避免的代表性误差。

在抽样法中,总体参数是未知的,需要用样本统计量加以估计。由于样本统计量是个随机变量,因此抽样误差也是个随机变量。

影响抽样误差大小的因素主要有以下两类:

(1)样本容量的大小。在其他条件不变的情况下,抽样误差的大小与样本容量n 成反比。一般来说,样本包含的单位数量越多,越能反映总体的数量特征,抽样误差越小;反之,抽样误差就越大。

(2)总体被研究标志的变异程度。在其他条件不变的情况下,抽样误差的大小与总体被研究标志的变异程度成正比。此外,抽样误差的大小还会受抽样组织方式和抽样方法的影响。抽样误差属于可控制的误差,可以通过调整样本容量的大小、选用合适的抽样组织方式和抽样方法进行控制。

(三)抽样平均误差

抽样平均误差是反映抽样误差一般水平的综合指标,是全及总体中所有可能样本的某一统计量与全及总体相应参数的平均离差,亦即所有样本某一统计量的标准差,又称为抽样标准误。

若以代表所有可能样本平均数的平均离差,用μp代表所有可能样本成数的平均离差,代表第i 个样本的平均值,pi代表第i 个样本的成数,以M 代表所有可能样本数目,则从理论上讲,有以下等式:

抽样平均误差是用来衡量样本统计量对总体参数代表性的重要尺度。在一定的概率保证下,抽样平均误差越小,样本统计量对总体参数的代表性越高。因此,在抽样推断中,用任何一个样本总体的统计量估计全及总体的未知参数时,都要以抽样平均误差作为计算抽样误差的依据。

在使用抽样平均误差判断抽样误差时,需注意以下三个问题:

(1)抽样误差的大小受不同的抽样组织方式和抽样方法的影响。(www.daowen.com)

(2)总体参数是未知的,上述关于抽样平均误差的计算公式虽然能反映其理论内涵,但在实践中无法应用。

(3)不可能也没有必要对所有可能样本进行统计调查。

因此,在实际工作中,需结合具体的抽样组织方式、抽样方法和抽样分布计算抽样平均误差。

(三)抽样极限误差

抽样极限误差是指样本统计量与总体参数之间抽样误差的可能范围。由于总体参数是一个确定的值,样本统计量是一个随机变量,因此样本统计量的值围绕着总体参数值左右变动。它可能大于总体参数值,也可能小于总体参数值,从而产生正误差或负误差。二者都可以用绝对值表示为等。这种以绝对值形式表示的抽样误差的可能范围,称为抽样极限误差或允许误差。

与ΔP分别表示抽样平均数的极限误差和抽样成数的极限误差,则有

在设计抽样方案时,抽样极限误差用来反映对抽样估计准确性的要求,也就是用样本统计量估计总体参数时所允许的误差范围。因此,抽样极限误差又称为抽样估计的允许误差限。

抽样极限误差通常以抽样平均误差为标准进行确定。一般来说,抽样极限误差用t 倍的抽样平均误差表示,即

因此,t 可按如下方法计算:

t 是用以衡量抽样估计可靠程度的参数,表示允许抽样极限误差为抽样平均误差的倍数,也被称为概率度。

(四)重复抽样与不重复抽样

根据同一单位是否允许被重复抽取,可以把抽样分为重复抽样和不重复抽样两种。

重复抽样又称放回抽样。在重复抽样方式下,每次从全及总体N 个单位中随机抽取一个单位,登记其编号和相应的标志值,之后将其放回,参加下一次抽选。依次连续进行n 次抽选后,将构成一个容量为n 的样本。重复抽样的基本特点:①在全及总体N 个单位中,抽取n 个单位组成一个样本总体,全部可能样本有M = Nn个,每个样本被抽取的机会或概率是相同的;②在n 次抽样中,总体中每个单位在各次抽样中被抽取的概率都相同,即n 次抽样就是n 次相互独立的试验。

不重复抽样也简称不放回抽样。在不重复抽样方式下,每次从全及总体N 个单位中随机抽取一个单位,登记其编号和标志值,之后不再将其放回总体参加下一次抽选。这种抽样方法实际上等同于一次从总体中同时抽取n 个单位组成一个样本。其基本特点:①在全及总体N 个单位中,抽取n 个单位组成一个样本总体,全部可能样本为个,每个样本被抽取的概率都是相同的;②每抽选一次,总体的单位数就相应减少一个,因此,在n 次抽样中,总体每个单位在各次抽样中被抽取的概率不同,即n 次抽样不是n 次相互独立的试验。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈