理论教育 数据处理与变量选择的优化策略

数据处理与变量选择的优化策略

时间:2023-06-10 理论教育 版权反馈
【摘要】:居民实际可支配收入上涨,会促使居民购买住房等固定资产,导致房地产供需平衡变化,推动住房价格上涨。城镇居民实际可支配收入只有季度数据,采用插值法将其转变为月度数据。

数据处理与变量选择的优化策略

3.2.1 被解释变量

为研究不同城市房地产调控政策的实施和退出对住房价格的影响,选取新建商品住宅销售价格指数作为被解释变量。新建商品住宅销售价格指数是以2008年1月为基期的环比数据,2008年1月的销售价格指数设为1。

3.2.2 控制变量

住房价格的变动不仅受到政策因素的影响,而且还受到宏观经济、供需等多方面作用,因此构建断点回归模型时还需考虑其他影响房价变动的变量,以全面分析房价变动的内在机理。本文从新建商品住宅需求、供应两个方面进行剖析,最后选取城镇居民实际可支配收入、新建商品住宅销售面积、商品住宅竣工面积和房地产开发投资占全社会固定资产投资额的比例等4个指标作为控制变量。

城镇居民实际可支配收入,能客观体现居民的需求,与住房价格高度相关[17]。居民实际可支配收入上涨,会促使居民购买住房等固定资产,导致房地产供需平衡变化,推动住房价格上涨。房地产投资额是决定房地产市场供给的重要因素之一,但是该变量是一个明显的内生变量,因此,选择房地产开发投资额占全社会固定资产投资额的比例作为控制变量[18],该变量既与房地产投资额具有较高的相关系数,又因对其他行业投资的外生性而不能被房地产开发投资额完全决定。新建商品住宅销售面积,能直接反映当前住房市场需求状况,与新建商品住宅销售价格之间存在着相互影响机制[19]。商品住宅竣工面积是决定住房市场供给的重要影响因素[20],是住房供给总量的具体表现形式。(www.daowen.com)

其中,新建商品住宅销售价格指数和城镇居民实际可支配收入均受通货膨胀的影响,因此利用居民消费价格指数(CPI)对变量进行修正。城镇居民实际可支配收入只有季度数据,采用插值法将其转变为月度数据。

3.2.3 变量数据预处理

为了避免变量的量纲差异对回归结果产生影响,均对数据采用标准化处理,即将数据值标准化在0~1,公式为

其中,rij表示第j个指标的第i个数据的标准化值,xij表示第j个指标的第i个数据的值,xj max表示第j个指标的最大值,xj min表示第j个指标的最小值。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈