【摘要】:但是当所有成分自变量的部分数增加时,现有的基于成分变量的线性回归模型不可用。第三种类型在文献[95]中有所研究,该文献提出了在一个成分因变量和一个成分自变量情况下基于clr系数的PLS回归,以及在一个成分因变量和多个成分自变量情况下基于clr系数的分层PLS回归。为了直接得到成分变量间的回归关系,需要研究单形上的PLS回归。本章研究第三种类型的基于成分因变量和成分自变量的偏最小二乘回归模型。
基于成分变量的回归分析分为三种类型,每种类型下的分析已经相当成熟。但是当所有成分自变量的部分数增加时,现有的基于成分变量的线性回归模型不可用。在这种情况下,可以使用偏最小二乘(PLS)回归。对于第一种类型,早期的研究介绍了对数对比PLS[96],之后又提出了基于clr系数或ilr坐标的判别PLS分析[28,107]。第三种类型在文献[95]中有所研究,该文献提出了在一个成分因变量和一个成分自变量情况下基于clr系数的PLS回归,以及在一个成分因变量和多个成分自变量情况下基于clr系数的分层PLS回归。
上面所有的PLS模型都是在实数空间上进行研究的,即通过对数比率变换将成分数据变换成实数空间上的坐标,然后在实数空间上使用经典的PLS回归。为了直接得到成分变量间的回归关系,需要研究单形上的PLS回归。本章研究第三种类型的基于成分因变量和成分自变量的偏最小二乘回归模型。不同于第四章,本章考虑所有成分自变量的部分数大于样本观测数的情况,解决如下两个问题:(1)如何在成分数据原始的样本空间,即单形上建立偏最小二乘回归模型(2)单形上提出的模型和实数空间上基于对称对数比率系数的偏最小二乘模型之间有什么关系?对于第一个问题,成分数据的样本协方差定义及单形上的多元线性回归是非常关键的。对于第二个问题,本章证明了这两个模型是等价的,即这两个模型估计的回归系数是相同的。最后通过代谢组学实际数据来分析尿液代谢物成分与血液代谢物成分之间的关系,结果表明回归系数的解释与生物学意义相符。(www.daowen.com)
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。
有关面向成分数据的回归分析研究的文章