理论教育 如何选择样本和处理数据?

如何选择样本和处理数据?

时间:2023-06-10 理论教育 版权反馈
【摘要】:人力资本:关于人力资本的估算,世界地区通用的做法是使用小学入学率来表示人力资本的丰裕程度,不过这种教育指标法虽然数据易得,但对于人力资本的测量误差较大,因此我们采用支出法测量人力资本,即使用教育支出占GDP的比重来衡量各地区人力资本的大小。

如何选择样本和处理数据?

由于需要在全世界范围内对各个经济体进行比较研究,我们将样本划定在一个全世界经济发展较为稳定的时间段内,也即20世纪80年代以后的时间范围,在这个时间内,各个国家从战后萧条逐步恢复到以谋求经济发展为主要目标,政治的不确定性对经济发展的影响较小;同时,囿于数据的可获得性,我们最终选择了89个国家(国家分布区域、列举一下,以脚注形式给出)和地区1990—2010年的数据进行分析。

(1)投入产出变量:总产出(Y)、劳动投入(L)和资本投入(K),分别从Penn World Table 8.0中获取,实际总产出(Y)为以2005年美元作为不变价的各国国内生产总值,劳动投入(L)为百万人口里参与劳动的人数,资本投入(K)为以2005年美元为基期的资本存量。

(2)人力资本(H):关于人力资本的估算,世界地区通用的做法是使用小学入学率来表示人力资本的丰裕程度,不过这种教育指标法虽然数据易得,但对于人力资本的测量误差较大,因此我们采用支出法测量人力资本,即使用教育支出占GDP的比重来衡量各地区人力资本的大小。(www.daowen.com)

(3)语言难度(diff):语言难度是语言特质的一个基本表现形式,语言难度因素反映了两个基本问题:一是处于不同语系的国家,一些语言会比另一些语言难,其学习难度取决于被学习国家的语言难度[12],这反映了语言的绝对难度;二是处于相同语系的国家,学习成本要比不在同一语系的难度要低,并且学习双语所需成本取决于该人的母语,这反映了语言的相对难度。由于本文涉及了世界89个国家的七大语系,因此我们使用语言的绝对难度衡量各国语言之间的差距,从语言学习规律出发,语言的核心由词汇和语法构成,由于语言难度与语法结构有关,我们选取反映时态变化的各类动词变位的种类作为语言难度的替代变量进行估计。一般来讲,动词变位越多的语言,其难度更高。例如,由于“阴阳”变化,拉丁语系的法语难度要明显高于英语。本文中动词变位的种类由各类语言的词典解释部分给出,而由于汉语在语法中并没有相应的动词变位,其时态语态的体现完全依靠助词,因此我们选取汉语助词的个数代表汉语动词变位的数量。

(4)控制变量的选择:①研发活跃度(RD与Researchers),政府参与研发支出可以提高全要素生产率已经成为不争的事实,通常情况政府对于科技创新的财政支持力度越大,研发活跃度越高,从而越有利于技术效率的提高,因此我们选取政府当年R&D支出占GDP的比重(RD)以及百万人口里研发人员的数量(Researchers)这两个指标作为研发活动活跃度的指标;②外商直接投资(FDI),FDI的技术溢出效应也是提高全要素生产率的重要影响因素,所以我们选择FDI净流入量占GDP比重来表示;③经济开放度(open),经济开放度的提高能够有利于技术溢出和效率的提高,通常做法是选取国家进出口贸易总额与GDP的比重来表示。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈