理论教育 多阶段抽样的优势及应用方式

多阶段抽样的优势及应用方式

时间:2023-08-06 理论教育 版权反馈
【摘要】:多阶段抽样所划分的抽样阶段数不宜过多,一般以划分两个至三个阶段为宜,至多四个阶段。在多阶段抽样中,前几个阶段的抽样,都类似整群抽样。每一阶段抽样都会存在抽样误差。现计算两阶段样本平均数的抽样误差,并以95%的可靠程度推断该地区居民每户平均收入。目前在我国抽样方法多采用多阶段、随机等距抽样方法。特大城市、大城市中采用三阶段抽样,中小城市采用两阶段抽样。

多阶段抽样的优势及应用方式

(一)多阶段抽样基本理论和方法

多阶段抽样,顾名思义就是在抽样调查抽选样本时并不是一次直接从总体中抽取,而是分两个或两个以上的阶段来进行。

多阶段抽样的作用:

(1)当抽样调查的面很广,没有一个包括所有总体单位的抽样框,或者总体范围太大而无法直接抽取样本时,须采用多阶段抽样。例如,全国农产量调查和城市居民的住户调查,样本单位遍布全国各地,显然不可能直接一次抽到所需的样本,只能分成几个阶段来逐级抽取。

(2)可以相对地节约人力与物力。从一个比较大的总体抽取一个随机样本,势必使抽到的样本单位比较分散,若要派人调查,人力和物力的支出比较大。例如,一个县要确定一些农户作样本,用一次随机抽样的样本很可能分布在全县各个乡,调查往返的路费就比较大。如果分阶段进行,先抽n个乡,然后在抽中的乡再抽若干户,这样可以使样本相对比较集中,因而可以节省人力和物力。

(3)可以利用现成的行政区划、组织系统作为划分各阶段的依据,为组织抽样调查提供方便。

以某省粮食产量调查为例。可以按行政区域划分层次,以省为总体,以县为抽样单位。步骤为:

(1)从全省所有县级单位中,抽取部分县作为第一阶段抽取的样本;

(2)从被抽中县的所有乡或村中,抽取部分乡或村作为第二阶段抽取的样本;

(3)从被抽中乡或村的所有农户中,抽取部分农户作为第三阶段抽取的样本;

(4)从被抽中农户的所有播种面积中,抽取部分地块,进行实割实测的调查,作为最基层阶段的样本,计算其样本平均亩产量,然后逐级往上综合估算平均亩产量,并推算总产量。

多阶段抽样所划分的抽样阶段数不宜过多,一般以划分两个至三个阶段为宜,至多四个阶段。

在多阶段抽样中,前几个阶段的抽样,都类似整群抽样。每一阶段抽样都会存在抽样误差。为提高抽样指标的代表性,各阶段抽取群数的安排和抽样方式,都应注意样本单位的均匀分布

首先,适当多抽第一阶段的群数,使样本单位在总体中得到均匀分布。但是,样本过于分散则需要更多的人力和经费。

其次,根据方差的大小,来考虑各阶段抽取群数的多少。对于群间方差大的阶段,应当适当多抽一些群;反之,则可少抽一些群。

最后,各阶段抽样时,可以根据条件,将各种抽样组织方式灵活运用,而且尽可能利用现成资料。

以两阶段抽样而论,首先将总体划分为R组,而每组包含Mi个单位。第一步从R组中随机抽取r组;第二步,再从中选的r组中分别随机抽取mi个单位,构成一个样本,这种抽样就是两阶段抽样。其中,总体单位数N=M1+M2+…+MR,各组的单位数Mi可以是相等的,也可以是不等的。样本单位数n=m1+m2+…+mr,各组抽取的样本单位可以是相等的,也可以是不等的。为简化起见,假定R组中各组的单位数相等,都为M,则有N=RM,而且从各组抽取的单位数也相等,都为m,则有n=rm。

两阶段抽样和类型抽样、整群抽样同样都须先对总体加以分组,然后再抽取单位,但它们之间却有明显的差别。类型抽样是从全部的分组中每组各抽取单位,它和两阶段抽样的区别在于第一阶段取了全部的组,而两阶段抽样在第一阶段只是随机地抽取部分的组。整群抽样是从全部的分组中随机抽取部分的组,然后对中选的全部单位进行调查,它和两阶段抽样的区别在第二阶段抽取了中选组的全部的单位,而两阶段抽样在第二阶段只是在中选组中随机地抽取部分单位。所以,两阶段抽样在组织技术上是整群抽样和类型抽样的综合。

现在从总体R群中随机抽取r群,并且从r群中,每群随机抽取m个单位,组成样本。以xij表示第i样本群第j个样本单位的标志值,第

式中,δ2——第一阶段抽样群的群间方差。

第二阶段抽样平均数的方差为

以上两阶段抽样平均误差

两阶段以上的多阶段抽样是两阶段抽样的推广,计算抽样误差的公式亦可同理推出。

举例说明:某地区共有30-000户居民,分成100群,每群包括300户,现欲调查居民的收入水平。如果用两阶段抽样,先以群为第一阶段抽取单位,从100群中抽6群,然后以住户为第二阶段的抽取单位,从抽中的群体中每群抽3户,调查其平均收入。现计算两阶段样本平均数的抽样误差,并以95%的可靠程度推断该地区居民每户平均收入。

各项资料见表6-11所示。

表6-11 两阶段抽样方差计算表

续表

全体样本平均数

各群内方差

各群群内方差平均数

各群的群间方差

两阶段抽样的样本平均数的抽样方差

现以95%的可靠程度推断该区居民每户平均收入为

即每户人均月收入应在3-623.75~4-820.69元之间。

上述各种组织形式各有其特点,在抽样调查过程中,结合各个阶段抽样的条件,可以把各种抽样组织方式灵活地结合运用。(www.daowen.com)

(二)多阶段抽样的实际应用——城市住户抽样调查为例

城市住户抽样调查内容包括:居民家庭人口状况,劳动就业状况,收入状况,现金收支状况,消费水平消费结构状况,市场价格变动对各类居民家庭的实际消费水平、消费结构、消费心理及承受能力的变化情况和影响程度,购买主要商品的数量及变化情况,耐用消费品的拥有量及变化情况,各类居民家庭之间收入、消费差异情况等。调查内容不同,但其抽样框的选取和确定却基本一样。目前在我国抽样方法多采用多阶段、随机等距抽样方法。特大城市、大城市中采用三阶段抽样,中小城市采用两阶段抽样。

1.调查户数和选户方法。城市住户抽样调查户数及选户方法一般为:

(1)根据现有辅助资料计算出市辖各区非农业居民占全市总计的比重;

(2)确定各区第一阶段抽选第二阶段抽样单位——居委会数;

(3)根据各重点调查市、县各阶层居民家庭居住分布以及调查力量的情况,确定第三阶段整群抽样的规模,即在每个抽中居委会中抽选多少居民家庭。

以A市为例,见表6-12和图6-5。

表6-12 A市一次性调查各阶段抽选单位数工作单

续表

图6-5 抽样方案实施流程图

第一步:将各区非农业居民数按表6-12第(1)栏要求分区填列,然后在表6-12中第(2)栏,以全市合计数为100,计算各区非农业居民数所占比例。

第二步:根据A市不同阶层居民家庭居住的分布情况及该市的调查力量情况,规定从每个抽中居委会抽选25户居民家庭。A市如应调查1-200户,因此需调查48个居委会。

第三步:考虑A市现行经常性住户调查的300个记账户由该市城市抽样调查队12名调查员负责,为了使每个调查员工作量分配均匀,本次调查每个调查员负责4个居委会。为了便于组织,从每个抽中街道中抽选2个居委会,这样共需抽选24个街道。

第四步:用表6-12第(2)栏各区非农业居民户所占比重乘以2(在每个抽中街道抽选2个居委会),得出各区拟抽选居委会数,见表6-12第(4)栏。

第五步:用25户(在抽中居委会中抽选25个非农业居民户)乘以各区拟抽选居委会数,便得到各区应抽选农业居民户数,见表6-12第(5)栏。这样设计的目的是为了使各区抽中的街道里抽选同等数量的居委会,在抽中的居委会中抽选同等数量的居民家庭,使得调查的组织实施简单易行,同时也兼顾了各区非农业户占全市总计的比例,使样本分布相对合理,从而提高样本的效率

2.抽样框的编制和抽选。

(1)第一阶段

①抽样框的编制。我国城市“人口变动情况统计表”的起报单位一般是街道办事处,各区在上报统计局该区人口变动的情况中包括区内各街道的资料,这个资料按表6-13“准备阶段使用”一栏要求将街道名称和非农业户数列出就可成为调查第一阶段的抽样框。由于各区应抽选多少街道办事处,事先已定好,因此是以区为单位抽选街道办事处的。一个城市有几个区,就应该分别做几个第一阶段抽样框,然后分区抽选。表6-13是A市四个区中的一个区,即二区各街道的情况。

表6-13 第一阶段抽样框

续表

②抽样方法。具体步骤以A市的二区为例:

第一步:计算抽选距离,即计算每隔多少户抽选一个街道办事处。

已知二区非农业居民户=152-624户

拟抽选街道数=7个

即每隔21-803个非农业居民户抽选一个街道办事处。

第三步:在抽样框“规定范围”一栏找到包括10-901个非农业居民户所在的街道办事处。

第四步:确定其余6个应抽中的街道办事处,它们是(见表6-13):

在“规定范围”一栏中找到包括这些数字的行,并在顺序号一栏画圈,抽中的打“√”号,并重新编号。各区都照此方法进行。第一阶段各区抽选工作便完成了。

(2)第二阶段

①抽样框的编制。第二阶段抽样单位是居委会,到抽中街道办事处索取居委会名称和各居委会居民家庭户数一览表(见表6-14),按表中要求登记,具体做法同第一阶段相似,便将第二阶段抽样框制作完毕。

表6-14 第二阶段抽样框

续表

②抽样方法。如前所述,A市在各抽中街道拟抽选两个居委会。仍以二区为例。在第一阶段抽选7个街道中,有一个街道15被抽中,我们继续以此为例,在这个街道进行第二阶段抽选工作,抽选两个居委会。

第二个被抽中的居委会是:2-314+1×4-628=6-942,即是第6-942个居民家庭所在的居委会。在上表“规定范围”一栏中查找2-314和6-942所在行对应的居委会名称,在顺序号上画圈,抽中打“√”号,重新编号。其余各抽中街道都照此法进行。

(3)第三阶段

无需另行编制抽样框,可从抽中街道办事处或派出所索取抽中居委会的居民户登记册,或从抽中居委会索取类似的居民户口登记卡片,作为第三阶段的抽样框,并从中抽选最终抽样单位——居民家庭。仍以A市为例,在二区抽中的街道15中抽中了第四居委会,索取到第四居委会的居民户口登记册后开始进行抽选。第四居委会有居民605户,拟在第三阶段每个抽中居委会中抽选25个居民户,因此,

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈