理论教育 精准控制:广义合成控制方法简介

精准控制:广义合成控制方法简介

时间:2023-06-11 理论教育 版权反馈
【摘要】:广义合成控制法是基于包含不可观测时变的混杂因素的面板数据固定效应回归模型的因果推断方法,它不仅放松了共同趋势假设,而且使用线性固定效应面板模型统一了双重差分法和合成控制法。白仲林等利用广义合成控制法分别研究了我国商品房限购政策的实体经济发展效应和自贸区设立政策的经济效应。置信区间的估计方法Xu通过参数自举方法得到广义合成控制估计量的方差估计。

精准控制:广义合成控制方法简介

广义合成控制法(Xu,2017)是基于包含不可观测时变的混杂因素的面板数据固定效应回归模型的因果推断方法,它不仅放松了共同趋势假设,而且使用线性固定效应面板模型统一了双重差分法和合成控制法。该方法借鉴了合成控制法的核心思想,根据处理前个体之间的截面关系为控制组个体选择合成处理组的权重,预测处理组的“反事实”结果,并利用潜在的共同因子控制了不可观测时变的混杂因素对个体处理效应的影响。白仲林等(2019,2020)利用广义合成控制法分别研究了我国商品房限购政策的实体经济发展效应和自贸区设立政策的经济效应。

(1)基本框架

假设Yit是个体i在第t期的结果变量,T和C分别表示处理组和控制组的集合,Ntr和Nco分别表示处理组个体数和控制组个体数,所有的个体均有T期观测值。设T0i为个体i接受处理的时期,控制组在观测期内不接受处理。为简化符号,假设所有的处理个体第一次接受处理的时期相同,即T0i=T0。首先假设Yit由线性因子模型给定,函数形式如下:

其中,δit为个体i在第t期的异质性处理效应;Xit为k维可观测控制变量,β=(β1,…,βk为k维待估系数向量;ft=(f1t,…,frt为影响所有个体的r维不可观测时变共同因子向量,控制了不同个体之间的空间相关性;λi=(λi1,…,λir为r维未知因子载荷向量;εit为个体i在第t期的异质性冲击,具有零均值。

令Yit(1)和Yit(0)分别表示个体i在第t期如果接受处理和如果未接受处理的潜在结果,即

于是,处理组个体i在第t期的个体处理效应δit=Yit(1)-Yit(0)(i∈T,t>T0),每一个个体的数据生成过程可重新写作:

其中,Yi=(Yi1,Yi2,…,YiT;Di=(Di1,Di2,…,DiT;δi=(δi1,δi2,…,δiT(符号″°″代表逐点运算(point-wise product)和εi=(εi1,εi2,…,εiT均是(T×1)维向量;Xi=(xi1,xi2,…,xiT是(T×k)阶矩;F=(f1,f1,…,f1是(T×r)阶矩阵。则处理组在t(t>T0)期的平均处理效应为(average treatment effect on the treated,ATT):

(2)基本假设

为了得到有效的政策评估结果,广义合成控制法还需要做出如下假设。

假设2.5:处理组和控制组受相同共同因子的冲击影响,并且观测期内因子个数保持不变,即模型结构保持一致。

假设2.6:强外生性假设,εit⊥Djs,xjs,λj,fs(∀i,j,t,s),表示误差项独立于所有个体任意期的处理变量Djs、协变量xjs以及不可观测的横截面和时间的异质性。

假设2.7:误差项允许存在弱序列相关和满足一定的正则条件。该假设下可以保证得到参数β的一致估计量。具体可参Bai(2009)、Moon和Weidner(2015)中关于弱相关性的假设。

假设2.8:残差项截面独立且同方差。一是对所有的i≠j,(t,s),有εit⊥εjs;二是对所有的(t,s),有E(εitεis)=σts≤M。

(3)未知参数的估计方法

模型的估计首先假定因子个数r是已知的,根据控制组样本{Yi,Xi}i∈C利用主成分法估计式(2.17),得到估计值,即

其中,D为对角阵。然后,基于与处理组在干预前的样本得到处理组的因子载荷,即(www.daowen.com)

从而,处理组在t期的平均处理效应估计为

另外,因真实因子个数r是未知的,而因子个数的确定实际上是模型选择问题,可通过标准的交叉验证方法得到。

(4)因子个数的估计方法

在上述求解处理组平均因果效应的过程中,要求因子个数是已知的。关于模型共同因子个数的选择,本书使用交叉验证法(cross-validation)进行估计。步骤如下:

步骤1:给定初始因子个数r0,利用控制组数据{Yi,Xi}i∈C估计式(2.16),得到

步骤2:对干预前的T0期进行交叉验证。

①令s∈{1,…,T0},除去处理组个体的第s期数据,对剩余的T0期之前的处理组数据进行OLS估计得到每个处理组个体的因子载荷:

②预测处理组在第s期的结果,保存预测误差eis=Yis(0)-

循环T0次,结束交叉验证过程;

步骤3:计算因子个数为r时对应的均方预测误差(MSPE):

步骤4:重复上述步骤,得到不同的因子个数r对应的MSPE(r)。

步骤5:选择使得MSPE取得最小值的因子个数r*

(5)置信区间的估计方法

Xu(2017)通过参数自举方法得到广义合成控制估计量的方差估计。根据可观测的协变量以及估计所得的不可观测的共同因子和因子载荷,通过对残差的重复抽样得到不确定的条件估计,即处理组平均处理效应AT^Tt的条件方差Varε(AT^Tt|D,X,Λ,F),进而可以根据传统的百分位数法构造平均处理效应的置信区间估计。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈