理论教育 倾向值预测与匹配:劳动社会评论.第2辑成果

倾向值预测与匹配:劳动社会评论.第2辑成果

时间:2023-08-13 理论教育 版权反馈
【摘要】:为处理样本中潜在的选择性偏差,本研究采用一般加速建模法对新建住房的倾向值得分进行估算。图1一般加速建模中各变量的影响力分布图2和图3显示的是新建住房变量的倾向值估计直方图和箱线图。图2倾向值估计直方图图3倾向值估计箱线图在具体的匹配过程中,我们使用了4种匹配方法,分别是卡尺为0.25σ 最近邻1对1匹配法、卡尺为0.01的最近邻1对1匹配法、马氏距离匹配法和加入倾向值的马氏距离匹配法。

倾向值预测与匹配:劳动社会评论.第2辑成果

为处理样本中潜在的选择性偏差,本研究采用一般加速建模法对新建住房的倾向值得分进行估算。图1显示了各个协变量在GBM中所解释的对数似然函数的百分比,其中家庭土地拥有状况的影响力最大,占所解释对数似然函数近37%;其次是一组人口学变量影响也较大,包括家庭人口数、被访者性别和出生年份,解释力分别为17.76%、10.50%和8.44%;第三是收入变量,包括第一次外出打工时的月工资和家庭年收入,解释力分别是12.34%和9.46%,其他协变量对新建住房也有影响但很小。

图1 一般加速建模中各变量的影响力分布

图2和图3显示的是新建住房变量的倾向值估计直方图和箱线图。图2表明新建和未新建住房两组在估计的倾向值分布上较为接近;从图3可知,两个组有很大的共同支持(common support)域,这个结果表明在贪婪匹配的过程中会保留多数样本而不丢失。

图2 倾向值估计直方图(www.daowen.com)

图3 倾向值估计箱线图

在具体的匹配过程中,我们使用了4种匹配方法,分别是卡尺为0.25σ 最近邻1对1匹配法、卡尺为0.01的最近邻1对1匹配法、马氏距离匹配法和加入倾向值的马氏距离匹配法。平衡性检验表明第2个方案——卡尺为0.01的最近邻1对1匹配法的效果最好,新建住房变量与每一个协变量的卡方检验(分类变量)或独立样本t检验(连续变量)均不显著,表明干预组(新建)与控制组(未新建)之间的样本匹配实现了平衡。因此,我们采用第2个匹配方案获得的新样本进行进一步的多元分析。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈