理论教育 如何选择主成分:以特征值大于1的前n个主成分为原则

如何选择主成分:以特征值大于1的前n个主成分为原则

更新时间:2025-01-03 理论教育 版权反馈
【摘要】:选取主成分个数需要遵循数据矩阵对应的特征值大于1的前n个主成分的原则。当主成分对应的特征值在1之下,说明与原变量解释力度相比,主成分解释力度处于较低水平。从表6-10中可以得到特征值大于1的主成分有三个,因此选取前三个主成分,同时注意到前三个主成分的累积方差贡献率达到92.516%。从而可以认为,原来的15个变量可以被三个新的主成分变量所取代。

本书采用SPSS22软件对数据进行分析,考虑到数据中的变量量纲不同,在抽取主成分时,主要以相关系数矩阵为基础。选取主成分个数需要遵循数据矩阵对应的特征值大于1的前n个主成分的原则。当主成分对应的特征值在1之下,说明与原变量解释力度相比,主成分解释力度处于较低水平。

从表6-10中可以得到特征值大于1的主成分有三个,因此选取前三个主成分,同时注意到前三个主成分的累积方差贡献率达到92.516%。

表6-10 方差分解之下的主成分提取结果表

从表6-10中得知,在三个主成分中,15个指标均位于第一主成分或者第二主成分上,说明第一主成分与第二主成分将指标信息基本体现出来,由此可见,通过提取主成分,每一个指标信息都可以基本体现出来,三个主成分所体现的信息量在信息重量中所占比例高达92.516%。从而可以认为,原来的15个变量可以被三个新的主成分变量所取代。将上述的主成分对应的特征值画成折线图即所谓的碎石图(图6-7),通过分析碎石图可以直观看出分析结果,当m=3时,碎石图中的曲线发生偏移,而且偏移角度最大。

图6-7 扶贫资金投向对贫困发生率影响因素崖底碎石图

经进一步运算后,可得表6-11及表6-12所示的初始3个因子的载荷矩阵,分别如下表6-11、表6-12所示。

表6-11 初始因子载荷矩阵

续表

对上述矩阵进行旋转后,得到如下矩阵:

表6-12 旋转后主成分矩阵(www.daowen.com)

通过旋转后的矩阵,得到的主成分得分与贫困发生率进行回归。回归模型如下:

第一主成分数据模型如下:

第一主成分中的产业发展和技术培投向类指标的系数相对都较大,因此可以将第一主成分看成是促进产业发展类因子。

第二主成分数据模型如下:

第二主成分中的基础设施建设投向和卫生设备投向类指标的系数相对较大,因此可以将第二主成分看成是基础设施建设投资类因子。

第三主成分数据模型如下:

第三主成分中的其他类指标的系数相对较大,因此可以将第三主成分看成是综合保障类因子。

综上所述,可以将影响贫困发生率的投资资金投向的三个主成分的影响因素归纳为促进产业发展类因子、基础设施建设投资类因子和综合保障类因子。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈