倾向得分匹配(PSM,Propensity Score Matching)是指通过对观测值进行评分对实验组和控制组样本进行匹配进而对干预事项进行分析的一类研究方法。罗森鲍姆和鲁宾(Rosenbaum & Rubin,1983)首次将倾向评分匹配的方法应用于生物统计领域给出了倾向值的定义为:基于完整的数据,将成员i(i=1,...,N)的倾向值定义:给定观测协变量向量Xi的情况下,成员i分配至某一特定干预(Wi=1)而不是非干预(Wi=0)的条件概率:
随后该方法被广为应用,特别是在20世纪90年代后,该方法开始被应用于卫生经济和其他社会科学领域。倾向值在匹配中的优点在于它对维度的简化:X向量可以包括很多协变量,它们代表着许多维度,而倾向值分析法将所有这些维度简化为一个单维的值。PSM的有效性取决于两个条件:(1)条件独立性;(2)共同支撑假设或平行假设。郭申阳(2012)在《倾向值分析:统计方法与应用》一书中对倾向值匹配分析法进行了全面而系统的分析。一般来说,该方法的使用分为三个步骤:第一,倾向评分(Propensity Score)。有多种方法可以使用观测协变量的向量来估计接受干预的条件概率,包括Logistic回归、Probit模型以及判别分析(Discriminant Analysis)等。本书使用最为主流的方法,即Logistic回归,通过这一方法可以找到最佳的条件变量或者协变量。根据定义,倾向值是一名研究的成员在给定观测变量下接受干预的条件概率;因此,接受干预的成员和接受控制的成员都具有非零的倾向值。更精确地讲,倾向值是一个平衡值,它代表一个协变量向量。在这种情形下,一对具有相似倾向值的实验组成员和控制组成员基本上被视为是可比的,即使他们也许在具体协变量的取值上会不同。第二,匹配(Matching)。在估计得到倾向值之后,下一步分析通常涉及基于估计的倾向值来匹配干预组成员和控制组成员。匹配的核心思想是在获得倾向值之后创建一个新的样本,其中的样本具有大致相同的可能性被分配至干预情形。匹配的方法包括最近邻匹配、半径匹配、核匹配以及马氏匹配。在本书中,因考虑到倾向值匹配的算法过于复杂,本报告主要使用能够通过stata软件自动运行的核匹配,而核匹配作为主要的匹配方法之一,选择该法并不会对实证结果造成不利的影响。第三,对样本进行匹配后的多元分析或基于匹配样本的分层(子分类),本书中并未进行第三步,故在此不做过多介绍。(www.daowen.com)
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。