按抽取样本的具体原则不同,抽样调查可以分为概率抽样和非概率抽样。
(一)概率抽样
概率抽样也称随机抽样,即在抽选样本的过程中,完全按随机原则进行,使抽样过程不受主观干扰,每个总体单元被选中与否与其入样概率大小有关。因此,概率抽样所得到的样本对所研究总体具有一般代表性,利用概率抽样结果可以推断总体特征,也可以计算并控制抽样误差。所以,概率抽样是一种科学的抽样方法。使用概率抽样所得到的样本称为随机样本。
概率抽样有两条基本准则:其一,单元是随机抽取的;其二,调查总体中的每个单元都有一个非零的入样概率,并且能计算出这些概率。在概率抽样中,如果总体中每个单元被抽中的概率都相等,则为等概率抽样;如果每个单元被抽中的概率不完全相等,则为不等概率抽样。例如:在一个盒中放入红、黄、蓝色球各一个,随机从中抽取一个,则各色球被取到的概率均为三分之一,这就是等概率抽样;而如果在盒中放入红、黄色球各一个、蓝色球两个,从中随机抽一个,则抽到红、黄色球的概率各为四分之一,而抽到蓝色球的概率为四分之二,这就是不等概率抽样。
概率抽样按其组织方式不同,可分为简单随机抽样、分层抽样、等距抽样、整群抽样、多阶段抽样等不同类型。
(1)简单随机抽样。简单随机抽样也称为纯随机抽样,是从总体的N个抽样单元中,每次抽取一个单元时,使每一个单元都有相等的概率被抽中,连续抽取n次,以抽中的n个单元组成简单随机样本。
简单随机抽样是一种一步抽样法,是所有概率抽样的基础,也是评估其他抽样策略效率的基准。与其他抽样技术相比,简单随机抽样的特点在于:这种抽样方法是最简单的抽样技术;抽样框不需要其他(辅助)信息,唯一需要的只是一个关于调查总体所有单元的一个完全的清单和与其如何联系的信息;关于样本量的确定、总体参数估计与方差估计都有现成的标准公式可以利用,技术发展已经成熟。但实际应用中也存在一定的局限性:抽样框中即使有现成的辅助信息也不加利用,这使得与其他利用辅助信息的样本相比,估计效率较低;由于样本在总体中的地理分布范围比较广,如果采用面访,费用较高;有可能抽到一个“差的”样本;如果不用计算机,而用随机数表抽一个大样本将十分单调劳神。
(2)分层抽样。分层抽样也称类型抽样,是实际工作中最常用的抽样技术之一。它是在抽样之前,先将总体按一定标志划分为若干个层(类),然后在各层内分别独立地进行抽样。由此所抽得的样本称之为分层样本,各层所抽得的样本也是互相独立的。如果每层中的抽样都是简单随机的,则这种抽样就称为分层随机抽样,由此所得到的样本称作分层随机样本。
采用分层抽样时,总体被分为同质的、互不重叠的若干层(子总体),然后在每一个层中独立地抽取样本,对每个层进行抽样可以使用任何一种抽样方法。为充分利用分层抽样的效率,层内必须有高度的同质性,即同一层内的单元的调查指标应是相近的,而不同层之间的差异应尽可能大。
分层抽样的优点是能提高总体参数估计值的精度;能保证样本对被定义为层的那些子总体的代表性,既可以对总体参数进行估计,也可以对各层的目标量进行估计;操作与管理方便;能避免得到一个“差的”样本;在不同的层中可以使用不同的抽样框和不同的抽样方法。分层抽样的缺点是要求抽样框中的所有单元都必须有能用于分层的辅助信息;与简单随机抽样相比抽样框的创建需要更多的费用,也更为复杂。
(3)整群抽样。整群抽样是先将总体各单元划分成若干群(组),然后以群为抽样单元,从中随机抽取一部分群,对中选群内的所有基本单元进行全面调查。确切地说,这种抽样组织形式应称为单级整群抽样。之所以采用整群抽样,是因为抽选群能大大降低数据收集的费用,当总体的分布比较广且调查采用面访时更是如此;同时,从总体中直接抽选个体在实际调查中并不总是可行的(没有关于个体的抽样框)。
整群抽样的优点:由于样本不如简单随机样本那样分散,能大大降低数据收集的费用;当总体单元自然聚合成群(例如:住户、学校)时,整群抽样比简单随机抽样更容易;如果对于调查变量而言,群内单元差异较大,而不同群的差异较小,整群抽样策略比简单随机抽样的统计效率更高(例如为估计性别比采用按户的整群抽样)。整群抽样的缺点:若群内单元有趋同性,则整群抽样的统计效率比简单随机抽样低,但对这类效率的损失可通过增加群的抽取个数来弥补;在进行调查前通常不知道一个群内具体有多少个单元,所以无法提前知道调查总样本量;方差估计可能比简单随机抽样更为复杂。
(4)等距抽样。等距抽样也称机械抽样,是将总体各抽样单元按一定的标志和顺序排列以后,每隔一定的距离(间隔)抽取一个单元组成样本进行调查的抽样方法。具体方法是:假设总体由N个单元组成,并按某种顺序编上1到N的号码,要在其中抽取容量为n的样本,先在前K个单元中随机抽取一个单元,以后每隔K个单元抽取一个单元,由所有抽中的单元共同组成样本,这种抽样方法就是等距抽样,这里K称为抽样间隔。可见,抽出了第一个单元就等于决定了整个样本。
等距抽样的优点:在事先没有总体单元名录的情况下也可以使用这种抽样方法,此时可以使用并构造一个概念抽样框(只需要单元的排列顺序),每间隔K个单元抽一个单元,直到总体的末尾;与简单随机抽样相比,等距抽样样本的分布较好(这还取决于抽样间隔及名录是如何排列的);等距抽样比简单随机抽样简单。等距抽样的缺点:如果抽样间距正好碰上总体变化的某种未知的周期性,就会得到一个“差的”等距样本,从而影响抽样精度;在使用概念框时,不能预先知道最终样本量;抽样方差没有一个无偏的估计量。(www.daowen.com)
(5)多阶段抽样。前面介绍的几种抽样方式,均是从总体中通过一次抽样,就可产生一个完整的样本,这类抽样可称为单阶段抽样。但抽样调查的实践中,常常面对的总体规模庞大,而且分布在广大区域内,很难通过一次抽样产生完整的样本。因此应是根据实际情况将整个抽样程序分成若干个阶段,逐阶段地进行抽样,以完成整个抽样过程。多阶段抽样就是用两个或更多连续的阶段抽取样本的过程。第一阶段抽取的单元称为初级或一级(阶)抽样单元(PSU),第二阶段抽取的单元称为次级或二级(阶)抽样单元(SSU),以此类推可定义更高级(阶)抽样单元。
在实践中如果是先从总体中随机抽取一部分一级单元,然后再从被抽中的一级单元内随机抽取部分二级单元并对它们进行全面调查,则称为是二阶段抽样。如果在被抽中的二级单元中,再抽取部分三级单元组成样本,并对抽中的三级单元进行全面调查,这就是三阶段抽样。类似地,有四阶段抽样或更高阶的抽样,通常将二阶段及以上的抽样称为多阶段抽样。二阶段抽样是最常见的多阶段抽样,例如,第一阶段抽样用地域框抽地理小区(PSU);第二阶段抽小区内的住户(SSU)。
多阶段抽样的优点:当群内单元对于调查变量是同质时,多阶段抽样比单阶整群抽样的效率高;样本分布相对集中,因此采用面访的旅行时间和费用都大为降低;不需要有整个总体的名录框,所要的只是在每个阶段抽样都有一个完整的抽样框。多阶段抽样的缺点:虽然多阶段抽样的效率比单阶整群抽样的高,但它没有简单随机抽样的效率高;通常不能提前知道多阶段抽样的样本量,因为在具体调查前,我们不知道在每个大单元中具体包含多少个下级单元(若固定每个大单元中的抽样数目,则总的样本量也可控制);调查的组织较为复杂(比单阶整群抽样复杂);估计值与抽样方差的计算较为复杂。
有些时候,概率抽样在实际中难以实现,如从海水中抽样,通常只限于一部分;从运煤货车中抽样,一般是从顶部进行等。此时,只能采用非概率抽样。
(二)非概率抽样
非概率抽样也就是非随机抽样,是由抽样者根据个人的知识、经验和研究目的,在主观分析判断的基础上来进行抽样。由于在抽样过程中不完全按随机原则进行,带有一定的主观随意性,所以所抽到的样本对所研究总体不具有一般代表性,不能用来估计总体特征,也无法估计和控制抽样误差。用非概率抽样取得的样本称为非随机样本。
非概率抽样主要包括:
(1)方便抽样。方便抽样是指在抽样时依据方便原则,以达到最大限度降低调查成本的目的。典型的形式是“拦截式”调查,如街边、公园或居民小区拦住行人实施调查,在商场门口或柜台向消费者进行调查等。方便抽样操作简单,能及时取得所需的信息,节省调查费用。主要局限是样本信息无法说明总体状况,不能根据样本信息对总体进行数量特征的推断,因而样本不适合描述性研究和因果关系研究。比较适合探索性研究,通过调查发现问题,产生想法和假设,也可以用于正式调查前的预调查。
(2)配额抽样。配额抽样是依据一定的标志将总体的各单元划分成若干类型,并按各类型在总体中所占的比例分配样本总量在各层的数额,以抽到各类型所需配额为止。从各类型中抽取样本的方法没有严格限制,一般采用方便抽样的方法抽取样本单元。配额抽样是美国的盖洛普(George Gallup)创立的,它是非概率抽样中比较科学的一种抽样方式。
(3)判断抽样。判断抽样是指在抽取样本时,调查人员根据经验、判断和对研究对象的了解,有目的地选取一些单元作为样本,实施时根据不同的目的有重点抽样、典型抽样、代表性抽样等方式。抽样时不依据随机原则,因而调查结果不能用于对总体有关参数进行估计。
(4)滚雪球抽样。滚雪球抽样是指调查中先从总体中找出满足调查条件的少数个体,通过这些个体了解其他个体,再由已了解到的个体去发现更多的个体,以此类推,了解到的个体越来越多,最后接近于总体。滚雪球抽样往往用于对稀少群体的调查,主要优点是容易找到那些属于特定群体的被调查者,调查成本比较低,适合对特定群体进行研究的资料搜集。
(5)自愿样本。自愿样本是指不经过抽取,而是由自愿接受调查的单元所组成的样本。比较典型的是以互联网为媒介的网上调查(或线上调查),调查人员将调查问卷贴在相关内容的网页上,感兴趣的读者可以自行填答;将调查问卷刊登在报刊上,读者可以自愿参加等。自愿样本的特点是样本的结构具有独特性,接受调查的样本单元往往属于某些特定的群体,例如,他们必须有接触到调查问卷的条件,同时对这项调查感兴趣,愿意积极参与。参与调查的群体与没有参与的群体可能会存在很大差异,调查结果无法推断总体。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。