理论教育 主成分分析法基本原理简介

主成分分析法基本原理简介

时间:2023-06-18 理论教育 版权反馈
【摘要】:主成分分析就是对原始变量进行降维的一种方法,其基本原理是将原来所需研究众多具有一定联系的相关指标X1,X2,X3,X4,…,XP,通过主成分分析重新组合成一组具有较少个数的互不相关的综合指标FN来代替原来指标。+ap1X p,所有成分的线性方程如下:主成分分析方法成立有以下两个条件:cov=0,即Fi,Fj是相互独立的。,XP在所有的线性组合中方差最大的。由上述可知该主成分蕴含的数据信息量最多。主成分之间相互独立。

主成分分析法基本原理简介

主成分分析就是对原始变量进行降维的一种方法,其基本原理是将原来所需研究众多具有一定联系的相关指标X1,X2,X3,X4,…,XP,通过主成分分析重新组合成一组具有较少个数的互不相关的综合指标FN来代替原来指标。对原始指标进行的综合表示,使得新的变量能够最大限度地代表原变量XP所代表的信息,又能保证新指标之间保持相互独立,所包含的数据信息没有重叠[26]

令变量F1表示原变量X1,X2,X3,X4,…,XP的第一个线性组合所形成的主成分指标,即F1=a11X1+a21X2+…+ap1X p,所有成分的线性方程如下:

主成分分析方法成立有以下两个条件:

(1)cov(Fi,Fj)=0,即Fi,Fj是相互独立的。

(2)F1是X1,X2,X3,X4,…,XP在所有的线性组合中方差最大的。由上述可知该主成分蕴含的数据信息量最多。因子Fi的方差贡献率反映了该主成分对原有变量的总方差解释能力,方差越大说明相应因子的重要性也越高。

主成分分析以损失最少的数据信息丢失为前提条件,将众多的原有变量综合成较少的几个综合指标,通常综合指标(主成分)有以下几个特点[27]

(1)主成分数量远远少于原有属性变量的个数。(www.daowen.com)

主成分是对原有属性变量的综合,因此得到新的属性变量远远少于原有的变量,新的属性变量也能够替代原有的属性数据进行数学建模,可以极大地减少建模过程中需要计算的数据量。

(2)主成分蕴含了原始数据的绝大部分信息。

主成分并不是对原有属性变量的简单取舍,而是对原有变量进行综合的结果,新组成的变量不但不会造成原有变量信息的大量损失,而且能够表征原有变量属性的大部分状态信息。

(3)主成分之间相互独立。

通过计算得到的几个主成分之间是相互独立的,综合成少数的因子能够涵盖大部分原始数据信息,利用提取后的数据对所要研究对象进行建模分析,能够很好地解决属性变量之间存在信息重叠带来数据分析处理的难题。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈