利用潜在结果框架讨论因果效应时,需要和某个干预(intervene)关联在一起,“没有干预就没有因果”(Rubin,1974)。其中干预就是原因,干预又称为处理(treatment)或操纵(manipulation)。不同的处理作用于个体所产生的预期反应称为潜在结果(potential outcome)。假定我们要研究原因变量D对结果变量Y的因果效应,则原因变量D称为处理变量或干预变量,它可以表示一项措施、政策、行动等,比如我国房地产市场价格调控政策、自贸区设立政策等等。假设观测个体共有N个,用虚拟变量Di表示第i个个体的处理状态(i=1,…,N),如果处理变量为二值变量,即对于任意个体i均存在两种干预状态:
Di=1表示个体i接受处理,所有接受处理的个体集合组成处理组;Di=0表示个体未接受处理,所有未接受处理的个体集合组成控制组,那么,在处理状态实现之前,每种处理状态对应于一个潜在结果。个体i在事前的潜在结果记为{Y0i,Y1i}:
Y0i表示Di=0时(个体i未接受处理时)潜在结果;
Y1i表示Di=1时(个体i接受处理时)潜在结果。
在处理状态实现之前,有几个干预状态就有几个潜在结果,而处理状态实现后,我们仅能观测到一个潜在结果,未实现状态下的潜在结果是无法观测的。对个体而言,这两个潜在结果可以看作是确定性的变量,不因个体处理变量的实现状态而改变。用Yi表示个体i的观测结果,则观测结果与潜在结果之间的关系为:
进一步地,(www.daowen.com)
通过潜在结果框架可知,政策处理效应的估计与检验可以被视为存在缺失值的问题,而非统计学中样本推断总体的问题(Imbens&Lemieux,2008;Imbens&Wooldridge,2009)。潜在结果{Y0i,Y1i}和观测结果Yi之间的区分是现代统计学和现代计量经济学的重要标志,是经济学经验研究“可信性革命”的关键,也是区分描述性研究和因果性研究的标志。
假定观测结果Yi由两部分因素决定:一是感兴趣的处理变量Di;二是除Di之外的所有其他因素ui。那么,可以用函数f表示三者之间的关系:
Rubin因果模型的核心是比较同一个研究个体(unit)在接受处理和不接受处理时的潜在结果差异,即对于个体i,原因变量Di对结果变量Y的因果效应是两种处理状态下潜在结果的比较,即i的个体因果效应为:
由此可见,在潜在结果框架下,因果效应的定义非常清晰,且不需要对分配机制进行任何内生性或外生性的假设,亦不需要对结果变量的函数形式进行任何假设。然而,因果推断面临的关键问题是同一个个体无法同时观测到Y0i和Y1i的值,对于观测个体,无法观测到的潜在结果,通常称为反事实结果(counterfactual outcome)。对单个个体而言,总有一个潜在结果是缺失的,所以无法得到个体水平上的因果效应的估计,Holland(1986)称之为“因果推断的基本问题”。另外,由于因果效应的定义仅依赖于潜在结果,研究者仅能观测到一个状态下的潜在结果,因此,如果仅有一个个体是无法得到个体的因果效应的。正因此,估计反事实结果成为因果推断的核心内容。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。