理论教育 TiSMoS:一种有效的缺失数据填补方法

TiSMoS:一种有效的缺失数据填补方法

时间:2023-06-03 理论教育 版权反馈
【摘要】:本文抛开TiSMoS国际收支数据补缺的方法不论,只研究它估算FATS缺失数据的方法。TiSMoS的出发点是既有的3套数据:欧统数据、OECD、一些国家数据。这个方法在TiSMoS代码表中为Z0.1、Z0.2和Z0.4。但是对于非OECD成员的内向数据缺失,用镜像数据——投资国外向数据来作为其估计值也是一种可取的办法。TISMOS在附件中列出这个系数集。这个方法在TiSMoS的编码表中代码为E9和E9.1。

TiSMoS:一种有效的缺失数据填补方法

本文抛开TiSMoS国际收支数据补缺的方法不论,只研究它估算FATS缺失数据的方法。

TiSMoS的出发点是既有的3套数据:欧统数据(外国控股欧盟企业——内向FATS,欧盟企业的境外附属机构——外向FATS)、OECD(跨国公司活动数据集)、一些国家数据。尽管这项研究的目标是建立一个与伙伴世界贸易的全球数据集,但是使用的是上述3个来源的双边贸易信息。

1.归0法

如果销售额总和报告数为0,则其子项均视作0。

若某国在报告国商业存在数为0(即未设立控股企业),则其销售额视作0。这个方法在TiSMoS代码表中为Z0.3。

如果两国间外国直接投资(FDI)存量为0,它们的双边FATS视作0。这个方法在TiSMoS代码表中为Z0.1、Z0.2和Z0.4(分别对应FDI信息来自国际基金组织数据库、欧盟数据库和OECD少数成员与伙伴国的FDI数据)。

2.镜像数据法

由于直接投资链条的复杂性,B国内向FATS所统计的A国在B国商业存在销售额,往往与A国外向FATS所统计的其在B国商业存在销售额对不上。但是对于非OECD成员的内向数据缺失,用镜像数据——投资国外向数据来作为其估计值也是一种可取的办法。

3.时序推插法——对部分数据有报告的成员的数据补齐方法

式中下标:f代表贸易流向;

i代表行业;

r代表报告国;

t代表时间(年份)。

式中变量名:poly代表时间序列趋势,取一次函数

Gdpsrit代表报告国特定时间特定行业增加值

BoPrit代表报告国特定时间特定行业国际收支口径贸易额;

待定系数:截距α;

β0为poly项的系数;

β1为Gdpsrit项的系数;(www.daowen.com)

γi为国家固定影响项,也是待定系数;

δf为贸易流向固定影响项,也是待定系数;

γi和δf又分别与gdpsrit和BoPrit发生交互影响;

这个回归模型通过最小二次法确定系数。时间序列中的缺失值通过回归模型得到估算。这个方法在TiSMoS的编码表中代码为E8。

4.引力模型法——对无数据报告成员的FATS数据集估算方法

TiSMoS估算无报告经济体FATS数据的“引力模型”

式中下标:r代表投资来源国;

s代表投资目的国(东道国);

t代表时间(年份)。

式中变量名:BoP代表国际收支表内一国与世界其余地方的贸易出/进口,出口分别用于测算外/内向FATS;

gdp代表一国国内生产总值

GDPpc代表一国人均国内生产总值;

dist代表投资来源国和目的国两国首都间距离,使用城市人口对全国人口的比率进行加权;

colony是二值定名变量,1代表两国间有殖民关系,0代表没有这种关系。

contig是二值定名变量,1代表两国间有共同边界,0代表没有这种关系。

comlang是二值定名变量,1代表两国各自至少有9%的居民与对方使用同一语言;0代表不满足这个条件。

使用普哇松伪最大似然法(Poisson Pseudo Maximum Likelihood—PPML)拟合模型的系数。TISMOS在附件中列出这个系数集。

这个方法在TiSMoS的编码表中代码为E9和E9.1(当估算值需要进行再调整,使其与所报告的上一级项目相配时)。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈