理论教育 空间计量模型分析及空间依赖性检验

空间计量模型分析及空间依赖性检验

时间:2023-06-11 理论教育 版权反馈
【摘要】:空间计量模型用来解释除地理单元外的经济主体行为,如个人、企业或政府,早期一直围绕横截面数据的点估计系数测试是否存在空间溢出效应。同时考虑时空特征的空间效应,使得模型估计更加有效。(二)空间自相关的识别与检验对空间依赖性的建模,一般先进行空间相关性的预检验。意味着空间滞后变量Wx仅表示邻近观测值的加权平均数。空间权重矩阵随邻居数量不同而异,Moran I最高值相应变化。

空间计量模型分析及空间依赖性检验

空间计量模型用来解释除地理单元外的经济主体行为,如个人、企业或政府,早期一直围绕横截面数据的点估计系数测试是否存在空间溢出效应。集中在应用Moran I和类似相关性检验回归模型的残差。替代方法基于最大似然框架,利用拉格朗日乘数法或Rao得分。近年来,研究扩展到包括面板回归和空间相关试验以及随机效应中异质性形式的变化(Baltagietal.,2007)。模型重点转移到多种类型的交互效应和解释变量边际效应,包括空间和时间动态效应,以空间权重矩阵和时间滞后项,分别定义空间和时间上的邻居。同时考虑时空特征的空间效应,使得模型估计更加有效。

(一)空间依赖性、空间异质性

空间依赖性(空间相关性)指某地所发生的事件、行为与现象,会直接或间接影响其他地方发生的事件、行为和现象。如果某一位置变量值高,其附近位置上该变量值也高,则为正空间正相关;反之,则为负空间自相关。空间相关性来源于观测数据地理位置接近(与地理学第一定律吻合)、截面个体间互相竞争和合作、模仿行为、溢出效应、测量误差。前四种来源即真实自相关反映在现实中存在的空间交互作用,与本书所述的空间近邻效应有关系,也证实了空间近邻效应不是简单的溢出效应。空间上彼此接近的观测点可能彼此直接影响,这样的近邻效应在地理上是集聚的,它遵循距离衰减函数,被称为地理学第一定律。忽视社会单位的近邻效应会影响观测单位展开过程的结果。这就等于忽视了制度扩散的假设:制度是如何传播的?创新者和滚雪球效应如何解释制度随空间和时间扩散的作用。空间依赖性不仅包括自相关也包括互相关(crosscorrelation),空间自相关中共同变量有类似值,如区域生产总在附近生产。在空间互相关中,区域i的生产也受区域j通过生产要素的依赖或影响(Jessie P.H.Poon,2003)。因此,“空间依赖性”可应用于更广泛的地域问题,从而来检验集聚、外部性、溢出、空间相互作用和层次相关的空间现象。

空间异质性指区域缺乏均质性,存在发达—落后、中心—外围等经济地理结构,导致发展和创新行为存在空间差异性,“通常用来反映经济实践中的空间观测单位之间经济行为(如增长或创新)关系的一种普遍存在的不稳定性”(陶长琪,2012)。创新主体与知识两者异质性的耦合导致创新行为在空间上差异显著,产生创新的相互依赖或局域俱乐部集团。空间依赖性(近邻效应)和空间异质性(区域影响)可以被识别。空间异质性只能通过空间结构获得额外信息,如模型的异方差性、空间变系数、随机系数和空间结构变化。它往往很难与空间依赖性区分,问题的实质是横截面数据可以识别簇和模式,但不能提供足够信息以确定导致该模式的过程。因此不能区分集簇是结构改变还是真实的传染过程。

(二)空间自相关的识别与检验

对空间依赖性的建模,一般先进行空间相关性的预检验。全域自相关是对属性在整个区域空间特征的描述,局域自相关是研究范围内各空间位置与周围邻近位置的同一属性相关性。常见检验统计量包括:Moran I(1950)、Geary C(1954)、Getis指数(Ord&Getis,1995)、LMerr(Burridge,1980)、LMsar、LR、Walds(Anselin1988)等。其中,Moran I和Geary C最常用,作用基本相同。

式中:xi——地区i的观测值;

xj——位置j的变量值;

n——地区总数;

Wij——邻近空间权值矩阵。

当Moran I>0时表明各地区某经济变量为空间正相关,代表相邻地区的类似特征值出现集群趋势;当Moran I<0时表明各地区某经济变量的空间负相关,存在空间排斥现象。右边项是方差的协方差比率,Moran I根据联系程度同时比较每一对位置的单个变量值,t分布结果可用于拒绝或同意零假设是否有自相关。当回归模型中存在自相关时,需要建立一个“滞后”因变量,即所有其他地点因变量的加权平均数,权重在这里指联系程度。包含滞后因变量的回归模型估计常用最大似然法。综合判断地区间行为的空间相关性,以及哪种模型更恰当,可通过表2.4中检验方法来实现。

表2.4 空间自相关检验方法

(三)空间权重矩阵

研究空间效应,通常采用外生的权重矩阵表达空间相互作用。n×n维的Wij包含区域i和j之间的空间连接信息(原因和联系程度)。Wij对角线上的元素被设为0,为减少区域间的外在影响,矩阵标准化为行元素之和等于1。意味着空间滞后变量Wx仅表示邻近观测值的加权平均数。按照Getis(2004)的归纳,空间邻近权重包括:空间邻接、反距离的幂、共享边界长度除以周长、K阶最邻近矩阵、加权质心的距离以及其他许多类型。一阶邻近矩阵假定在两个地区有共同边界时空间关联才会发生,其中Rook邻近仅以共同边界来定义,Queen邻近则还包括共同顶点的邻居。高阶邻近矩阵(Anselin&Smirnov,1996)目的是消除在创建矩阵时出现的冗余及循环。最邻近矩阵和高阶邻近影响有更大的绝对值,尤其是当邻近矩阵结构相当的国家又地理邻近时。这些相互依存关系可以摆脱区位特殊因素或缺少东西的互补性,但仍需要区位间相互作用的渠道或途径(Kocornik-Mina,2007,2009)。采用K值最邻近空间矩阵(Anselin,2003)是因为基于门槛距离的简单空间矩阵会导致不平衡的邻近结构,面积较小的地理单元有很多邻近单元,较大地理单元则很少甚至没有邻近单元。一般选择最邻近的4个单元,具体根据实际空间关联情况确定。空间权重矩阵随邻居数量不同而异,Moran I最高值相应变化。

更复杂的权重矩阵包括经济和社会因素,通过交通运输、通信量、国内生产总值(GDP)、贸易流、资本流、人口迁移、劳动力等确定宾语,计算各地区任何两个变量间的距离。如利用两地区之间经济发展水平(人均)差距的绝对值的倒数来衡量地区之间的相关性,两个地区发展水平越接近,则空间关联性越强,否则越弱。政治或社会现象的网络或联系通过历史的共享或高频率的交互来影响(Deutsch,Isard,1961)。只要这些分析不违反连接矩阵中邻近的假设,都可以应用。有些研究结合多个空间权重,如EA Eff(2001,2004)检验文化样本的空间自相关和“亲缘”自相关,设置距离(经纬度)、语言(语言门,即血缘)、文化复杂性(与具有更多差异的社会关联程度)三套权重。Nathaniel Beck(2005)同时考虑地理和政治经济概念的距离,在民主分布的空间分析中使用贸易连接变量和共同矢变量,贸易规模大的伙伴比规模较小的伙伴被赋予更大的权重,其研究结果也表明贸易关系包含独立于地理距离的信息。收集到的数据中混合距离和其他因素,很难单独分析任何地理距离的影响,以及检验其他因素如何修改距离所产生的影响。或许因此,基于地理概念的距离仍占主导。应用经济、社会因素的权重更契合区域现实,在空间效应测算中更科学更理想,但统计数据难以获得。选择权重矩阵需要考虑对模型的适用性,估计系数对权重矩阵的敏感性,最终依据结果的客观性科学性。本书研究涉及空间权重矩阵的计算,首先按地理距离选指标,主要采用Anselin(1999,2003)的空间统计分析软件GeoDa1.4.6,直接生成邻近矩阵来测算并确定地区间的空间效应。

(四)空间常系数回归模型及估计

本书主要研究综合考虑变量时空二维特征和信息的空间面板常系数回归模型,包括固定效应、随机效应、空间误差自相关和空间滞后因变量模型。空间异质性用解释变量的系数表示,在固定和随机效应模型中,截距随不同空间单元而不同。同时考虑时间和空间相关性,更客观地描述受时空交互作用的创新行为的特征。再引入因变量的时间和空间滞后项,构建空间动态面板数据模型。

1.空间滞后或空间误差模型的选择。

模型的选择即确定用SAR或SEM模型,同时涉及在固定效应和随机效应模型中选择(地区固定、时期固定、双固定、混合面板)。鉴于空间回归模型自变量的内生性,需要通过IV、ML或GLS、GMM等其他方法来进行估计。根据Anselin和Florax(1995)的简单判别准则,通过比较LMLag和LMErr,以及R-LMLag和R-LMErr的统计显著性,判断适合的模型是空间滞后或空间误差模型。

(1)空间滞后模型(SLM,SAR)探讨变量在一个地区是否有扩散(或溢出效应),因变量设为相互影响。

式中:ρ——溢出效应系数;

β——自变量对因变量的影响;

WY——空间滞后因变量(内生),表示空间距离对区域行为的作用;

μ——正态分布随机误差项。

假设存在空间效应ζ的情况(张志强,2012):

Y=ρWY+Xβ+ζ+μ变形为(I-ρW)Y=Xβ+ζ+μ后,进一步简化为:

对式(2.4)求关于ζ的偏导,并依据最优化的一阶条件得到ζ的值:

将ζ代入式(2.4),依据估计面板固定效应时所采用的去平均化过程,得到如下拟似然函数:

(2)空间误差模型(SEM)反映误差项中存在空间依赖作用,表示邻近地区关于因变量的误差冲击对本地区观察值的影响。

式中:β——自变量X对因变量Y的影响;

ε——随机误差项;

μ——正态分布的随机误差向量;

λ——n×1阶的截面因变量向量的空间误差系数,λ表示相邻地区的观察值Y对本地区Y值的影响方向和程度。

(3)空间通用模型(SAC;general SpatialModel)既包括因变量的空间滞后项,也包含误差项的空间滞后项。

在空间滞后的误差模型中,邻近地区产生影响的唯一途径是相互关联的误差项;一些地区的误差项就是所有其他邻近地区的所有误差项(将误差过程表现为来自不同区域误差的空间协方差)。但“误差”只是不测量或不能测量的变量,尤其是来自分析者的观测误差,而非该地区制度行为主体造成的误差(Nathaniel Beck,2005)。误差自相关模型存在方程误设定问题,一般是方程右边遗漏了相关变量(McMillen,2003)。如果空间外部性主要是如Anselin(2003)所描述的,有理由发现实质性的横截面空间依赖关系(滞后内生变量)。空间滞后误差模型不是首先要考虑的,模型的选择要根据理论和数据分析,而非假设。只有当理论和数据表明适当时,才使用SEM模型,本书空间计量首选SAR模型。Abreu等(2005)批评过度依赖空间误差模型和空间滞后模型,提出空间横截面模型(SC-RM),包括一个或更多个右边解释变量的空间滞后项。Y=X1β+φWX2+μ;μ~(0,σ2 In),由于在模型中涉及的空间滞后项是外生的,因此,这些变量不会直接导致模型的估计偏差。本书认为,如果结合空间杜宾模型(R Dubin,2003)就可以解决Abreu等(2005)所指的“过度依赖”问题,杜宾模型可以看作空间误差、空间滞后和空间横截面模型的一般形式,但估计仍需采用ML方法。

2.固定效应和随机效应估计。

在固定效应模型中虚拟变量衡量每个空间单元的截距变化,在随机效应模型中变截距被视为服从零均值和方差独立同分布的随机变量。对于单因素效应模型,如果仅关心解释变量的效应,可假定个体单因素效应ξi(或时间单因素效应λt)是随机的,那么就可避免固定效应模型中存在的普通最小二乘法(OLS)估计量有偏、自由度损失过多和结论不能对样本外的经济行为进行推断问题。即关于个体单因素效应模型(2.8)和时间单因素效应模型(2.9):

如果ξi与μit相互独立,并且对于所有的i和t,Xit与ξi和μit也相互独立,则称为个体随机效应模型。类似地,如果λt与μit相互独立,并且Xit与λt和uit也相互独立,则称为时间随机效应模型。异质性不随时间变化且独立于相关因素,随机效应模型有助于控制这种异质性。Hausman检验用于测试随机效应模型与固定效应模型。空间滞后或误差模型和固定或随机效应的组合有四种,包括空间固定效应滞后模型、空间随机效应滞后模型、空间固定效应误差模型、空间随机效应误差模型。鉴于首先考虑滞后模型,以及参数的变化可导致固定与随机效应的转变,故本书主要采用空间随机效应滞后模型,推导参见J.Paul Elhorst(2003)。

3.直接效应和间接效应的估计。

如表2.5所示,直接效应测试一个特定变量对自身经济的独立变量是否有显著效应,间接效应测试是否存在空间溢出(即其他单位变化的加总)。一个特定单位变量的总效应是直接效应与间接效应的总和,效应扩散的估计取决于所有系数的估计。一些Matlab或R程序和Stata工具包,可以计算直接、间接效应和相应的标准误差或t值,最终只有这些效应估计可被用来对关系模型得出推论(Elhorst,2014)。

表2.5 不同模型的直接和间接效应(www.daowen.com)

来源:根据Halleck Vega和Elhorst(2013)整理。

在这些模型中溢出效应在性质上是全局溢出的。任何位置X的变化会传递到所有其他位置,根据逆矩阵方程:(I-ρW)-1=I+ρW+ρ2W2+ρ3W3+…即使根据W两个位置并不相连接。局部溢出效应发生在其他地方不涉及逆矩阵,即只有那些根据W相互连接的位置。局域效应仅产生于一个单位的邻域集;如果空间权重矩阵的元素wij是非零(或0),那么Xjk对Yi的影响也非零(或0)。全域效应并不来自一个单位的邻域集,全局溢出效应包括反馈效应,即通过邻近单位(从区域i到j再到区域k)反馈回变化源(区域i)所产生的影响,而局部溢出效应并不包括(LeSage,Pace,2011)。SLX模型和SDEM模型的直接效应用非空间变量的系数估计(βk),溢出效应与空间滞后的解释变量(θk)相关。这些模型主要用于检验局部溢出效应,不适用于全局溢出效应模型。SDM和GNS模型都是全局溢出模型。SAR和SAC以及SDM模型的一个主要局限性是,没有事先限制直接效应和溢出效应的比例关系。为呼应后文内容,在此以杜宾模型(SDM)进行分析。

检验空间溢出效应存在与否,用点估计形式可能得到错误结论,用偏导数形式为假设检验提供更坚实的基础,用偏导表示变量改变的影响比系数估计检验假设更有效,构建模型的空间外溢效应更灵活(LeSage&Pace,2009)。改写方程(2.10)空间和时间动态效应的空间计量经济学模型得到:

偏导数矩阵Y相对于单位1到单位N的第K个解释变量X,在特定的时点可看作关于Y对k阶解释变量x,求单元1到单元N的偏导数矩阵:

式(2.12)中偏导数表示某个空间单位特定解释变量受所有其他空间单位因变量短期影响的变化效应。长期效应可看作:

LeSage and Pace(2009)和Debarsy等(2011)定义的直接效应是式(2.12)或式(2.13)矩阵右边对角线元素的平均值,间接效应是矩阵非对角元素行之和或列之和的平均值(两种计算的间接效应数值一样)。即空间杜宾模型的直接效应:img,表示某地区变量Xk的单位变化对所有N个地区的平均影响。总效应:Mtot(k)=iN([I-ρW]-1[INβk+Wφk])iN(1/N),表示某地区变量Xk的单位变化引起所有N个地区变量Xk的单位变化,对所有地区的平均影响。结果独立于时间指数,这就解释了为什么这些方程右端不包含符号T。式(2.12)和式(2.13)也表明如果ρ=0和θk=0,则短期间接效应不发生,而ρ=-η和θk=0,则长期间接效应不发生。模型中,如果某单位一个特定解释变量发生改变,不仅依赖于该单位本身因变量的变化,也有赖于其他单位因变量的变化。前者称为直接效应,后者是间接效应。当θk≠0时存在的间接效应,被称为局部效应,当δ≠0时的间接效应,被称为全域效应。

4.空间交互作用及模型的确定。

在空间计量经济模型中有三种不同的交互作用类型:①因变量Y的内生互动效应,即单位1的因变量y↔单位2的因变量y之间;内生交互作用被视为一个空间或社会互动过程的均衡结果,其中一个主体的因变量值由邻近主体共同决定。②独立变量x的外源性交互作用效应,即单位2的自变量x↔单位1的因变量y之间;外源性交互效应指某单位因变量取决于其他单位的独立解释变量。③误差项ε中的交互效应,即单位1的误差项u↔单位2的误差项u之间。Elhorst(2014)考虑相互作用的不同组合,以及它们之间的关系,还介绍了这些模型直接和间接效应的估计。Debarsy(2010)的创新点是提出一个替代方法,以评估双向随机效应。互动的异质性由冲击系数或弹性简化计算而得,通过考虑空间面板数据模型中个体之间的互动结构。利用Monte Carlo实验,Lee和Yu(2010)指出,忽略时间固定效应可能导致空间滞后系数较大的向上偏差,原因是不同空间单位的大多数变量往往随时间同时增加和减少(如,经济周期)。如果没有考虑这个共同影响,没有从空间单位间的相互作用中区分出来,后者的影响就可能被高估。Lee和Yu(2010)用最大似然估计渐近的SARAR面板数据模型,发现可能同时存在时间和个体固定效应。在时空耦合的语境中,本书选择同时具有地区和时间变量的一般嵌套模型(GNS,the general nesting spatial model),即同时包括单元之间相互影响的三种不同类型:地区固定时间随机模型、时间固定地区随机模型、地区和时间双固定模型。假设异方差一般嵌套模型(HGNM):

式中:WY——因变量之间的内生性相互影响;

WX——独立变量间的外源性相互影响;

Wμ——不同干扰项之间的相互影响;

ρ——空间自回归系数

λ——空间自相关误差系数;

θ——一个固定但未知参数的K×1矢量

W——已知常数非负n×n矩阵,对角线上的元素被假设为零。

对于SARAR模型:

式中:ζmax——空间权重矩阵W的最大特征值;

ζmin——空间权重矩阵W的小特征值。

如果W的行是随机的,1≤ρ≤1,则(I-ρW)-1可以扩展为权重系列:(IρW)-1=I+ρW+ρ2W2+ρ3W 3+…。其中,W是一个给定区域关于邻居的空间权重,W2是邻居的邻居的权重,W3是邻居的邻居的邻居的权重等。所以计算(IρW)-1 Xβ可以用:Xβ+ρWXβ+ρ2W2Xβ+ρ3W3Xβ+…。在SEM中用(I-λW)-1 u。

按照布里奇(Burridge,2011)从一般到特殊的建模步骤:第一步,估计异方差一般嵌套模型(1)中M=W=Q。第二步,检验简单的同方差性。第三步,检验简单的SDM或ADL模型。第四步,检验不拒绝SLM模型,或拒绝简单的SARAR模型。第五步,检验如果不拒绝SDM或ADL模型,但不拒绝SLM模型或拒绝简单的SARAR模型,检验共同因素和SEM模型。如果拒绝SDM或ADL模型,同时拒绝SLM模型或不拒绝简单的SARAR模型,检验SDEM模型。对包含交互效应的模型现在有三种估计:最大似然估计法(ML)或拟最大似然估计法(QML)、工具变量或广义矩法(IV/GMM)、贝叶斯马尔科夫链蒙特卡洛方法(MCMC)。Anselin(1988),Lee(2004),Kelejian等(1998)和Lesage等(2009)给出了这些方法及其应用的详细技术说明。对这包含三类交互效应的模型进行估计,问题是,估计的参数很难给出有意义的解释,三类效应很难区分。Lee等(2010)证明至少存在一个空间权重矩阵可全部估计含三类交互效应的模型系数。对于外生给定的空间权重矩阵,常用一般模型的简化版本:空间滞后模型(SLM)(包含第一种空间交互效应),空间误差模型(SEM)(包含第三种)和空间杜宾模型(SDM)(同时包含第一和第二种)。其中SDM模型更具综合性:当θ=0时,SDM退化为SLM。当θ=ρβ时,SDM退化为SEM。LeSage和Pace(2009)指出,忽略误差项的空间效应仅损害估计效率,而忽略因变量及自变量的空间效应相当于遗漏了解释变量,导致估计偏误和不一致。因此Elhorst(2010a)建议考虑因变量和自变量的空间效应,即先估计SDM模型。然后用Wald、LR或LM检验两个假设:H0:θ=0和H0:θ=ρβ,看SDM是否可简化为SLM和SEM。本书分析时采用另一种形式,同时考虑个体固定(或随机)和时间固定(或随机)效应,也同时考虑内源性和外源性的交互效应的模型(James LeSage,2007),具体模型结果按估计结果确定。各模型之间的变化关系见附录图2.1:

5.空间动态(SDM)面板模型。

空间动态面板模型可分为3种类型(Anselin,2008)。

(1)纯空间递归模型:

空间依赖性仅适用于前一期的邻近位置。t期yi取决于t-1期相邻位置yj’s的加权平均。

(2)时空递归模型:

空间依赖性同时涉及本身的位置和前一时期其邻居的位置。在t期的yi取决于t-1期相邻yj’s的加权平均和以及t-1期的yi

(3)时空同步模型:

同时包括本身位置的时间滞后与空间滞后。t期的Yi取决于t期相邻yj’s的加权平均和,以及t-1期的Yi

空间动态面板模型:

模型中包括动态滞后、空间滞后、空间误差相关、外生变量XN(t)严格假定外生。可通过时空滞后WN yN(t-1)或空间外生变量WNXN(t)进一步拓展。

例如,外生变量的空间滞后WNXN(t-1),可用作时空变量或空间滞后外生变量的工具变量,如果β≠0或XN(t)的相关性随着时间变化。

空间杜宾模型是横截面空间依赖误差模型的简化形式,也在通用模型选择时被用作嵌套模型。杜宾模型是在时间序列中非常特殊的一种情况,需要估计经济模型误差项的一阶自回归AR(1)过程:

在计算ρ的迭代过程中,开始ρ等于零值,在某些情况下这会导致一致性问题。为此,杜宾(1960)提出用LS直接估计AR(1)的非约束形式:

Anselin(1980)将其针对空间分析进行修改:

式中:ρ——随机项中SAR(1)过程的自回归参数。

动态模型可将变量的时期相关性也容纳进去,使得空间面板模型动态化,可通过添加时间滞后变量Yt和WYt得到:

式(2.24)模型是一个动态的空间杜宾模型(Debarsy etal.,2011)。考虑时间滞后变量Xt和WXt,误差项μt和Wμt等时间滞后项。但这种一般模型不可识别(Anselin etal.,2008),Elhorst(2012)为解决该问题给出了一些限制:(1)令θ=0以排除外生互动效应WXt;(2)令ρ=0,以排除同期的内生互动效应WYt;(3)令η=0,以排除滞后的内生互动效应Wy(t-1);(4)令η=-τρ,化简后方程右边保留Yt-1(动态因素)和外生互动效应WXt。四个限制条件分别至少排除一种互动效应。

6.空间面板模型的估计方法及软件。

面板数据的一个问题是,在不均质的空间,区位参数会随不同地理位置而变动。系数当然也可以随时间而变化,但Elhorst(2003)不讨论这种并行情况。Pesaran和Smith(1995)等主张放弃混合模型同样参数的基本假设,要求限制用个别回归来估计平均反应。传统面板数据技术的主要问题就是,只允许获得“平均”或代表性的行为。面板数据回归方程的斜率不变,确保整个空间单元的平均效果,甚至不显示个别空间的个体行为差异(Quah,1996)。估计空间变量之间关系的第二个原因是,该模型可以整体误设定,因为一个或多个相关变量已被错误地从模型中省略或采用了不正确的函数形式。本书尽量采用固定和(或)随机效应模型,并结合其他研究方法。

考虑扩散情况,非空间OLS估计可能存在严重的遗漏变量偏差,倾向于高估共同冲击效应,即忽略扩散过程,将导致夸大外部刺激的重要性。相反,如果忽视共同冲击或建模不充分,空间OLS通过空间滞后项直接确定扩散,往往会高估扩散效应。空间依赖的直接建模,甚至在OLS模型中通过相对简单的空间滞后,能极大地改善非空间(内部和外生)效应的估计,特别是确定扩散程度以及国内和共同冲击。为克服这些问题,目前空间模型估计方法主要有三种:①Kelejian等(2013)采用由Kelejian和Prucha(1998,1999,2004)发展的“广义空间两阶段最小二乘法”(GS2SLS),这是一种特殊形式的高斯混含模型(GMM)。②空间两阶最小二乘法(S-2SLS,spatial two-stage leastsquares)或工具变量(S-2SLS-IV),使用x和Wx作为Wy的工具变量。只有xj是外源性且与yi相关时这种方法才有用。③采用最大似然(ML)估计ρ和β以确定Wy的内生性。S-ML模型,容易低估相互依存的强度,特别是N较小的时候。此外S-ML模型难以实现(Beck,Gleditsch,Beardsley,2005)。用Bartels(1991)的话来说,如果工具变量与所有非零ε没有任何程度的相关,那么工具变量只是准工具变量,工具变量均方差取决于工具变量和内生解释变量的协方差相对于工具变量与ε协方差的比值。如果变量X、ξ、η和ξη独立于ε,WX就是完整的工具变量。在研究实践中,面临右边X变量是左边y变量的内生变量,即标准的内生性问题,y导致X同时X导致y。如果这样,WX将是不完全的,或是准工具变量(第j个X也包含某个i的y)。研究者能用2SLS-IV估计法解决X和y的内生性问题,以及空间2SLS-IV估计法解决空间同步性问题。问题是,将WX作为准工具变量有赖于ε间和X间扩散机制的相对大小,分别用γ和ρ表示,y对X的因果机制用α表示,X对y的因果机制用β表示。尚未充分证明这一猜想和理论或进行Monte Carlo实验,也没有用2SLS-IV确定X和y的内生性,以及用空间2SLS-IV确定y的同时性问题。因此,RJ.Franzese,JC.Hays(2004)建议要么采用严格外生的X来确定空间工具变量Wx,或者解释为什么X用于Wx具有良好的“巴特尔比”(Bartels Ratios),这种情况,转化为高比值的ρβ/γα。埃洛斯特(Elhorst;2005,2008,2010,2014)、Yu等人(2008)、Lee和Yu(2010)应用最大似然(ML)估计和组合的ML以及校正的最小二乘虚拟变量估计。对于本书的分析ML具有比其他方法更多的优点,包括具有现成软件可以应用。估计软件主要有R和Matlab,R软件中splm包用于估计空间面板模型。Matlab是本书主要采用的软件。其中,面板数据的固定效应SAR模型直接调用“sar_panel_FE”程序,固定效应SEM直接调用“sem_panel_FE”程序,用sem_panel_RE(y,X,W1,W2,T)估计空间随机效应面板模型。对于固定效应(地区固定、时间固定、双向固定、混合模型)的选择,只需要对某些代码进行设置。通过将程序参数X改变为[xW x]就可以估计SDM、SDEM和GNS模型。每一次运行程序的估计结果都是一样的。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈