1.数据来源与指标处理
本文中所采用数据的来源详见第288页表5。由于个别数据在数据库中缺失,因此我们通过搜罗相关文献从中获取合适的数据。具体来源是:铁路里程数据中,阿根廷、玻利维亚、巴西、博茨瓦纳、智利、哥伦比亚的铁路里程数据来源于蔡馥秋《1979年世界各个国家和地区铁路营业里程》;人均电力消费的数据中,毛里求斯的数据根据尤·丘莉帕科娃(1981)《毛里求斯的经济发展》中1977年国内电产值数据以及1968—1977年的电产值增长率估算出1978年数据;能源自给率数据中,毛里求斯的能源自给率数据也是根据《毛里求斯的经济发展》中毛里求斯进出口中的能源数据和国内总产值的数据计算出。博茨瓦纳的能源数据则源自阿·阿尔丘欣(1983)《博茨瓦纳的经济和对外贸易》。外债存量数据中,智利的数据来源于苏振兴、卢后盾(1981)《智利的经济复兴政策及成效》,且是1980年外债存量数据;DPT免疫接种率数据中,中国、肯尼亚、尼日利亚以及南非缺失1978年数据,我们则通过建立回归方程的方法,运用已有数据进行估测;女性劳动参与率数据中,世界劳工组织KILM数据库中没有中国女性劳动参与率的数据,因此,我们采用了潘锦棠(2002)《经济转轨中的中国女性就业与社会保障》中提供的数据;能源净进口反映的是各国能源自给情况,但对于能源出口则不是我们研究的重点,所以对于能源净进口数据中的负值,我们则一律用0代替。韩国的外债存量数据和毛里求斯的道路部门能源消耗量数据缺失,也无法从其他文献资料中获得,因此只能空缺,各指标数据具体来源见表5。
表5 基础指标数据来源一览表
各发展中国家经济社会发展绩效评价指数涉及26个基础指标,由于是横截面数据,共两个数据缺失,因此,缺失数据对于总体评价的影响基本可以忽略。整体来说该数据集质量较高,基本能够反映各国经济社会发展状况。
由于各基础指标的属性和量纲量级不同,使得我们无法对其直接进行合成,因此在进行主成分分析之前,需要进行一定的变换与处理,对于指标属性问题,经济社会发展评价指数的各个基础指标属性是不同的,如果对不同性质指标直接加总就不能正确反映不同作用力的综合结果,因此我们对所有逆指标均采取倒数形式使所有指标对经济社会评价的作用力趋同化。对于量纲量级问题,经济社会发展评价指数的各项基础指标分别具有不同的量纲和量级,如果直接采用原始值就会造成主成分过分偏重于具有较大方差或数量级的指标,因此我们选择均值化方法对原始指标进行无量纲化处理[7]。
在进行主成分分析时,既可以使用相关系数矩阵,也可以使用协方差矩阵,现有研究文献一般采用相关系数矩阵,使用正态标准化后的数据作为主成分分析的输入,这样可以消除量纲的影响,避免主成分过分依赖于量级过大的指标变量,但是由于各指标变量都具有单位标准差,就可能导致低估或夸大不同指标的相对离散程度。而采用均值化后的协方差矩阵不仅可以消除量纲和数量级上的差异,还能保留各指标在离散程度上的特性,避免低估或夸大指标的相对离散程度。因此,本文选择协方差矩阵作为主成分分析的输入。
基于此,在进行主成分分析之前,我们对所有逆指标采取倒数形式使其正向化,适度指标采取原始值与适度值的差值的绝对值进行处理,通过均值化方法对原始数据进行无量纲化处理,并以协方差矩阵作为主成分分析的输入。(www.daowen.com)
2.基础指标与方面指数的权重确定
但是单个主成分综合原始数据信息的能力是以其贡献率来衡量的。这样的方法反映的仅是前面几个主成分单独综合原始数据信息能力的总和,其综合原始数据信息的能力不可能超过前面几个主成分的累积综合能力,第一主成分综合原始数据信息的能力是最强的。因此,我们采用第一主成分来确定权重,将第一主成分系数除以其相应的特征根开根后所得到的单位特征向量作为基础指标的权重,由此求得各方面指数,再以同样的方法计算各方面指数的权重(表6),最终获得1952—1978年经济社会发展绩效评价指数值。
表6 各基础指标、方面指数的系数向量与相应权重
续表
由上表可见,经济发展在第一主成分指数中的权重最高,为0.6818,这说明在1952—1978年间各个国家的发展更多的仍然依靠经济的发展,各国经济结构以及经济增速的不同造成了各发展中国家1978年之前发展的不同。其次,社会发展与经济遗产在1952—1978年发展中的权重大致相同,分别为0.0862和0.0729,这说明这两个维度对1978年之前经济社会发展指数的贡献大小基本相当。最后是自力程度的权重最小为0.0442,这说明相比于以上3个维度,外部环境对1952—1978年经济社会发展的影响是最小的。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。