理论教育 基于对称对数比率系数的偏最小二乘回归模型的成果

基于对称对数比率系数的偏最小二乘回归模型的成果

时间:2023-11-17 理论教育 版权反馈
【摘要】:不失一般性,假定y j,x k都为中心化的成分变量,在本小节,基于经典的PLS回归来建立成分变量clr系数之间的关系[94,108,109,110,111]。,q)是一个D k×1向量,且满足,D=是C×1向量,u=是D×1向量,r是给定的PLS成分个数,可以通过一些最小化或停止准则来确定。为了解决PLS问题,本章使用简单偏最小二乘算法[94]。,h r的线性回归模型其中θjl(l=1,2,…,p)和自变量U的回归方程为对于实数空间上的模型满足判定系数为其中‖·‖F代表矩阵Frobenius范数。

基于对称对数比率系数的偏最小二乘回归模型的成果

考虑p个成分变量y 1,y 2,…,y p和q个成分自变量x 1,x 2,…,x q,其中y j∈S Cj(j=1,2,…,p),x k∈S Dk(k=1,2,…,q)。假定每个变量有n个观测值,则样本数据集记为

其中Y j(j=1,2,…,p)和X k(k=1,2,…,q)分别为第j个因变量y j和第k个自变量x k的样本数据集,y ji和x ki分别为变量y j和x k的第i(i=1,2,…,n)个观测值。不失一般性,假定y j,x k都为中心化的成分变量,

在本小节,基于经典的PLS回归来建立成分变量clr系数之间的关系[94,108,109,110,111]。成分变量y j(j=1,2,…,p),x k(k=1,2,…,q)的clr系数记为v j=clr(y j),u k=clr(x k),对应的样本数据集为

因变量v j(j=1,2,…,p)和自变量u k(k=1,2,…,q)的PLS因子m 1,m 2…,m r和h 1,h 2,…,h r

其中θlj(j=1,2,…,p)是一个C j×1向量,w lk(k=1,2,…,q)是一个D k×1向量,且满足,D=是C×1向量,u=是D×1向量,r是给定的PLS成分个数,可以通过一些最小化或停止准则来确定。

根据公式(2.4.1),由于0Cj,因此h l和m l的样本协方差

其中代表实数空间上的样本协方差。

为了解决PLS问题,本章使用简单偏最小二乘算法(SIMPLS)[94]。考虑优化问题

权重向量w ll可以通过拉格朗日乘数法求解[95,96],求出的解见如下定理。

定理6.1.1 优化问题(6.1.1)有向量解:w l(l=1,2,…,r)是矩阵H l-1 UV T VU T最大特征值相关的单位特征向量,且θlH 0=I D,H l=I D-UU T W l[W T l UU T UU T W l]-1W l=(w 1,w 2,…,w l)。

证明 优化问题(6.1.1)等价于

对于公式(6.1.2)的优化问题,根据文献[95,96],w l(l=1,2,…,r)是矩阵H l-1UV T VU T最大特征值相关的单位特征向量,且其中H 0=I D,H l=I D-UU TW l=(w 1,w 2,…,w l)。求解的w ll满足优化问题(6.1.1)的如下条件(www.daowen.com)

现在证明如上条件。

(1)因为w l是矩阵H l-1UV T VU T的特征向量,可以得到H l-1UV T VU T w l=λw l,其中λ是最大特征值且不为零,则w l

其中第三个等式成立是因为(k=1,2,…,q)。

(2)类似地,因为(j=1,2,…,p),可以得到

因此优化问题(6.1.1)和(6.1.2)有相同的解。

记PLS因子h l(l=1,2,…,r)的样本数据集为h l=U T w l,因为则h l的样本均值为零。建立变量v j(j=1,2,…,p)和h 1,h 2,…,h r线性回归模型

其中θjl(l=1,2,…,r)是一个C j×1向量且满足e j是一个误差项矩阵。参数可以通过最小二乘方法进行估计

最后,因变量V j(j=1,2,…,p)和自变量U的回归方程

对于实数空间上的模型(6.1.3)满足

判定系数为

其中‖·‖F代表矩阵Frobenius范数

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈