理论教育 原始数据处理:Z-score标准化公式

原始数据处理:Z-score标准化公式

时间:2023-06-10 理论教育 版权反馈
【摘要】:在经济增长质量评价指数合成之前,首先对获取的原始数据进行处理。获取的原始数据难免有数据噪音存在,同时可能还有数据空缺或数据中出现异常值等因素。第二步,指标的统一化处理。本文则采用Z-score标准化公式对数据进行处理,公式如下:通过无量纲化之后,各项时间序列均值为0,标准差为1。

原始数据处理:Z-score标准化公式

经济增长质量评价指数合成之前,首先对获取的原始数据进行处理。获取的原始数据难免有数据噪音存在,同时可能还有数据空缺或数据中出现异常值等因素。为了提高评价与预测的准确性,获取的数据经过处理才可使用,否则可能所得结果并不准确,甚至可能得到与现实相悖的结论,因此这一步骤必不可少,通常数据处理需如下几步:

第一步,剔除原始数据中大于相邻均值正负三个标准差的极端值,空缺值用线性插值法进行替换,以便观测时间序列长期趋势。

第二步,指标的统一化处理。在本文所建立的指标体系中,同时包含有正向、逆向及适度指标,需要将逆指标与适度指标转化为正向指标。本文采用较为常用的取倒数的方法将逆向指标正向化。本文参考相关学者的研究成果,确定两项适度指标的最佳值。其中,投资率最佳值为38%,消费率最佳值为60%,计算方法如下,其中xi为原始值,为适度值:(www.daowen.com)

第三步,本文所构建指标体系是从增长效率、经济结构、经济稳定性、生活水平、生态环境等五个维度的指标汇总而成的,获取的数据并没有统一的计量单位,不同类型数据之间不可避免地存在量级差异,如果直接采用原始指标对经济增长质量进行计算,可能会造成不同单位指标的权重赋予不合理,各指标之间不可简单相加和比较。因此在主成分分析前需处理数据,现有研究中无量纲化最常使用的是标准化方法。本文则采用Z-score标准化公式对数据进行处理,公式如下:

通过无量纲化之后,各项时间序列均值为0,标准差为1。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈