理论教育 分配机制及其在观测研究中的应用

分配机制及其在观测研究中的应用

时间:2023-06-11 理论教育 版权反馈
【摘要】:分配机制是潜在结果框架的第三个要件。第一类分配机制是随机实验。最后,除上述两类分配机制外,将其余所有的分配机制称为依不可观测变量选择,又称为非正则机制。通常这种情况下,分配机制与潜在结果是相关联的,处理组和控制组的差异无法被观测。因而,在观测研究中,分配机制也可称为选择机制。Fisher提出的随机分配机制是识别因果作用最有效的方法。

分配机制及其在观测研究中的应用

分配机制是潜在结果框架的第三个要件。潜在结果中的哪个结果能够被观察到完全取决于个体所接受的处理分配,因此“分配机制”是潜在结果模型的一个核心内容,它直接决定什么样的结果能够被观察到。

分配机制(Assignment Mechanism)是通过关于处理变量Di的概率模型来描述哪个潜在结果可以被观测到的机制,即:

分配机制是区分不同研究设计的依据,根据分配机制是否已知可将分配机制分为三类:随机实验、依可观测变量选择(Selection on Observable)、依不可观测变量选择(Selection on Unobservable),其中后两类属于观测研究。

第一类分配机制是随机实验。在随机实验中,接受处理的概率仅为可观测协变量的函数,而与潜在结果无关。另外,干预状态可以通过一定的随机机制实现,且研究者知道随机机制和分配概率。Fisher(1935)最早在其著作《实验设计》中提出了“随机化实验”的思想,他指出只要处理状态的分配是随机的,就可以排除其他因素的影响,从而识别因果效应。随机化实验的作用就是平衡处理组和控制组个体其他因素(除处理变量之外的各协变量)的分布,即两组个体的其他影响因素的差异都是偶然性的,在统计上一般是不显著的。因此,两组结果变量的系统性差异只能是由是否接受导致的。在传统的因果推断思想中,尤其是自然科学的研究中,人们往往采用“控制”的思想,即控制影响结果变量的所有其他因素,仅让感兴趣的原因变量随机变化,这种情况下结果变量的变化可归结为原因变量导致。

第二类分配机制为依可观测变量选择,又称为政策分配机制(Regular Assignment Mechanism)、非混杂性(Unconfoundedness)或条件独立性假设(Conditional Independence Assumption,CIA)。具体而言,是指分配概率不依赖于潜在结果,且分配机制的函数形式未知,即在控制观测变量Xi之后,个体干预状态的分配不依赖于潜在结果,其形式化表示为:

即以可观测变量Xi为条件,处理变量Di独立于潜在结果Y0i和Y1i以及潜在结果的任何函数。

在非混杂条件下,估计平均处理效果的文献是非常成熟的,有些估计量采用匹配方法(每个处理个体与具有相似协变量值的控制个体对比),有些估计量对观测值进行加权,以使得加权后处理组和控制组的观测特征相似,另外一些估计量利用倾向得分等,常用的方法有:工具变量法(Imbens&Angrist,1994;Angrist&Krueger,2004)、双重差分法(Ashenfelter,1978;Ashenfelter&Card,1985)、断点回归、合成控制法、回归合成法、机器学习的相关方法以及其他放松非混杂性条件的方法(Manski,2007)等等。

最后,除上述两类分配机制外,将其余所有的分配机制称为依不可观测变量选择,又称为非正则机制(Irregular Assignment Mechanism)。通常这种情况下,分配机制与潜在结果是相关联的,处理组和控制组的差异无法被观测。此时,对可观测特征进行控制并不能有效识别处理效应,在此类研究中还需要进一步地施加其他假设或采用其他方法。

下面看一个简单的例子来了解分配机制的作用。

假定在一个“施肥对番茄产量的影响”研究的实验中,园艺研究员种植了许多块番茄地。随机地选择50%的地块,对其施肥100克/米2;其余则不施肥。在番茄生长季节末,园艺员称量了每块地上收获的番茄。施肥和未施肥地块的每平方米的平均产量之差即为施肥对番茄产量的效应。(www.daowen.com)

假定共有n块地,用Yi表示结果变量,此例为第i块地每平方米的番茄产量,用Di表示处理变量,此例为第i块地是否施肥,即

根据施肥与否可以将所有地块分为两组,处理组(所有施肥地块)和控制组(所有未施肥地块)。直接利用两组观测结果进行比较,将发现施肥对番茄产量的影响,即E(Yi|Di=1)-E(Yi|Di=0)。分配机制的说法一般用在实验中,因为实验设计者或研究者可以控制分配机制,让哪些个体进入干预组,哪些个体进入控制组。而在观测研究中,个体往往根据自己的效用选择进入不同的群组。因而,在观测研究中,分配机制也可称为选择机制。观测研究的目的就是想办法将观测数据中未知的分配机制识别出来,从而估计因果效应。

Fisher(1935)提出的随机分配机制是识别因果作用最有效的方法。这一方法的核心在于“随机”二字,根据统计学的原理,如果让随机机制决定个体的处理分配,且确保样本量足够大,则随机分组的结果等同于因果效应。在随机实验中,处理变量既与协变量独立:Xi⊥Di,也与潜在结果独立:{Y0i,Y1i}⊥Di。其中,处理变量与协变量独立可以确保除处理变量之外的其他混杂因素(可观测的和不可观测的)的分布在各组是平衡的,因此结果变量之间的差异可完全归于处理变量;而处理变量与潜在结果独立,摒除了处理分配的自选择性,消除了选择偏差。此时,由{Y0i,Y1i}⊥Di,可得,可见因果推断中的反事实可由控制组的结果变量的观测值予以估计,因此在随机分配机制下平均处理效应是可识别的,且不同处理下的结果变量观测值的均值之差即为平均因果效应的无偏估计。

除了完全随机实验之外,常用的随机实验还有分层随机实验,在分层随机实验中有非混杂性条件成立:,即按照协变量Xi分层,层内的个体的潜在结果独立于处理分配,因此层内因果效应可以识别。可见,在随机化实验下,因果效应总是可识别的,这也是其被视为因果推断黄金准则的缘由所在。

鉴于研究成本、伦理约束和实施难度等问题的限制,随机实验在社会科学中的应用相对较少,更为常见的是观察性实验。在此类实验中,个体进入处理组或控制组是非随机分配的,此时{Y0i,Y1i}⊥D。处理分配的非随机是由协变量的不同导致的,意味着不同组的个体特征在处理分配前可能存在事前差异,因此使用观测性数据进行因果推断的困难之处在于与处理变量及结果变量都相关的混杂因素扭曲了它们之间的关系。此时,若采用简单的前后对比或横向对比的分析方法会忽略这种差异,继而导致处理效应的有偏估计,甚至会造成悖论。为解决观察性实验的因果效应识别所面临的挑战,Rubin(1973,1974,1977,1978)的一系列论文提出了观察性实验中因果效应的识别条件——强非混杂性假设。该假设是对分配机制的假设,其精确形式由Rosenbaum&Rubin(1983)首次给出:

(i)非混杂性假设:

(ii)共同区间假设:

其中,条件(i)意味着按协变量X进行分层,在层内进行随机分配;条件(ii)确保每一层内都存在处理组个体和控制组个体,以便在每一层得到该层内的平均因果效应的估计。在非混杂性假定下,当Xi是较低维的离散变量时,可以直接按Xi分层进而估计各层的平均处理效应,然后加权得到总平均处理效应。当Xi是高维的,或者是连续型变量时,按Xi的值分层会导致数据稀疏问题,此时通常需要建立参数模型来估计因果效应。

非混杂性假设体现了随机实验和观察性实验的差别。在观察性研究中,处理分配Di不是随机的,若仅仅非混杂性假设成立,但不对混杂因素进行调整必然会导致选择偏差。因此,观察性研究中的因果推断需要对协变量X进行调整,典型估计方法包括匹配和分层法等。不可观测混杂因素可能导致个体所受的处理与潜在结果相关,此时分配机制部分依赖于潜在结果。这种情况下的因果效应识别没有普适的研究设计,目前仅对一些特殊的机制开发出针对性的评估方法,如双重差分方法。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈