为了解决因果推断中随时间变化的未观测混杂因素造成的内生性问题,进一步优化因果推断分析方法,根据处理个体和多个控制个体结果变量在政策实施前后的多期面板数据,Abadie et al.(2010,2015)等提出了合成控制法(Synthetic Control Method,SCM),并将其应用于研究美国加州1988年第99号控烟法的效果和1990年两德合并对西德人均GDP的影响。合成控制方法根据政策干预前处理组和合成控制组的特征,赋予控制组个体相应的权重,从而期望政策干预后的处理组如果没有受到政策干预,其行为仍然与合成控制组非常相似,即合成控制组事后的观测结果可以作为处理组个体的反事实结果的估计。因此,处理组和合成控制组事后观测结果之差就是对政策干预因果效应的估计。
假设有N+1个地区共T个时期的面板数据,Y1,it表示个体i在t期受到政策干预时的潜在结果,Y0,it表示个体i在t期没有受到政策干预时的潜在结果。从而个体因果效应为:
Dit表示个体i在t期的处理状态,若个体i在t期受到政策干预,则Dit=1,其他取0。则个体i在t期的观测结果为:
假设第1个个体在T0(1<T0<T)期后受到政策干预(处理组),其他N个个体所有时期均没有受到政策影响(控制组),即
由于个体1是处理组,因此对于t>T0,有τ1t=Y1,1t-Y0,1t=Y1t-Y0,1t。对于t>T0期,我们可以观测到潜在结果Y1,1t=Y1t,但无法观测到反事实结果Y0,1t。因而,政策评价的关键是如何估计出个体1在T0期后的反事实结果Y0,1t。为估计个体1的反事实结果,假设潜在结果Y0,1t可以用下列模型表示:
其中,δt是一未知的共同因子,对所有个体具有相同的影响;Zi是r×1维可观测协变量向量,θt是1×r维未知系数向量;μi是K×1维未观测协变量向量,λt是K×1维未知系数向量;εit是未观测的暂时性冲击,假设其在地区层面满足零均值。考虑N×1维权重向量W=(ω2,…,ωN+1)',满足
每个特定的权重向量W代表一个特定的合成控制,对于权重W,合成控制模型为:
可以证明,如果干预之前时期足够长(T0→∞),则上式趋近于0,从而处理组个体1的反事实结果近似可以用合成控制组来进行表示,即
因而处理组个体1的政策干预效应可以表示为:
如果条件(2.15)成立,存在权重向量W*,使得事前各期合成控制组与处理组的观测结果Y相等且所有可观测特征Z相同,从而,合成控制组与处理组的未观测因素μ也会相同,即。这意味着合成控制组和处理组非常相似,从而可以将合成控制组的行为模式作为处理组个体反事实结果的估计。(www.daowen.com)
事实上,条件(2.15)中的等式一般不会完全相等,除非在的凸包内。在应用中,很难保证条件(2.15)等号恰好成立,一般是保证等号近似成立。如果处理组向量在控制组凸包之外,可能无法找到合适的权重向量。这时,将无法找到合适的合成控制组,需要使用其他的方法,比如允许权重为负的回归合成方法(Hsiao et al.,2012)等。
实际如何求解权重向量W*呢?令X1表示处理组个体的事前特征,为M×1维向量,包括可观测协变量Z1和事前结果Y1t的若干线性组合。令X0表示控制组的事前特征,为M×N维矩阵。由于实际应用中,X1通常在X0的凸包之外,因此,合成控制权重W*=最小化下面的距离
其中,Xjm是个体j的第m个协变量,V是一个M×M的对称正定矩阵,通常是对角阵,对角元素为vm。权重vm反映了不同协变量的相对重要性,权重ωj反映了控制组个体的相对重要性。V的选择很重要,合成控制W*将依赖于V的选择,不同的V将得到不同的合成控制组W*。v1,…,vm的选择目前有三种方法,参见(Abadie et al.,2010;2015)。
在利用合成控制方法进行比较研究时,一般个体数不会太多,因而,基于大样本的假设检验方法往往不适合。为了检验合成控制法得到的参数估计是否显著,即给定原假设政策效应不显著(假设政策干预对个体没有因果效应)。目前存在两种类型的安慰剂检验(placebo test),也称为证伪检验(falsification test):时间安慰剂检验和个体安慰剂检验。
时间安慰剂检验
如果事前时期较长,可以构造一种时间安慰剂检验。仅利用政策干预前的数据,并设定一个假想的政策干预时间,运用合成控制法估计政策效应。因为所使用的数据都是政策干预之前的信息,所有个体都没有受到真正的处理,利用同样的合成控制方法,如果得到显著的政策效应,则说明,前面的估计可能存在着问题。相反,如果发现没有显著的政策效应,则证明,前面的合成控制方法可能是有效的。
个体安慰剂检验
原假设是政策干预对个体没有因果影响,将处理组个体放入控制组中。从控制组抽出一个个体,利用合成控制方法,估计出相应的政策效应。对应于N个控制组个体,会得到N个相应的政策效应的估计,从而可以得到政策效应估计的一个具体分布(exact distribution)。然后检测估计的处理组个体因果效应在整个分布中所处的位置。如果处于分布尾部的5%,则说明如果原假设成立,那么观测到估计的政策效应的可能性低于5%。则可以拒绝没有政策影响的原假设,从而说明估计是显著的。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。