面向成分数据的回归分析研究

面向成分数据的多元线性回归研究

实数空间上基于ilr坐标的多元线性回归模型为其中ilr(v i),ilr分别代表的是因变量v i和自变量u ji(j=1,2,…,B q的估计值可以通过如下方程来求解下面的定理给出了单形上的回归模型与实数空间上的回归模型的参数之间的关系。在下面的定理中,可以看到模型的截距向量和回归系数矩阵可以通过模型的参数来表示。如果等式两边分别左乘矩阵P L,l 0ΨL,则可以得到通过与模型进行对照,很容易得到模型是一个经典的多因变量回归模型。
理论教育 2023-11-17

异方差线性回归模型的参数推论

根据定理4.3.2可知因此模型的参数矩阵A的显著性检验结果可以通过模型中参数矩阵B的推论获得。基于引理5.2.1,的方差为倒数第二个等式成立是因为cov(ilr((i≠j)。由公式可知则B Q的普通最小二乘估计为倒数第二个等号是基于Q矩阵是正交矩阵得到的。根据定理5.1.1和公式,可以获得实数空间上模型中B=的估计和假设检验。最后,预测的成分数据集为考虑均方根距离作为模型的评价指标,小的RMSD代表模型有高的预测精度。
理论教育 2023-11-17

基于对称对数比率系数的偏最小二乘回归模型的成果

不失一般性,假定y j,x k都为中心化的成分变量,在本小节,基于经典的PLS回归来建立成分变量clr系数之间的关系[94,108,109,110,111]。,q)是一个D k×1向量,且满足,D=是C×1向量,u=是D×1向量,r是给定的PLS成分个数,可以通过一些最小化或停止准则来确定。为了解决PLS问题,本章使用简单偏最小二乘算法[94]。,h r的线性回归模型其中θjl(l=1,2,…,p)和自变量U的回归方程为对于实数空间上的模型满足判定系数为其中‖·‖F代表矩阵Frobenius范数。
理论教育 2023-11-17

成分数据回归分析研究结果:不同方法间的模拟分析对比

本小节中我们将进行多种模拟分析。为了描述不同成分之间的多种相关性水平,取ρ=0.3,0.5,0.7和0.9。对于不同的探测范围对应不同的近似零值比率,本节所提出的方法与已有方法效果的比较结果见图3.1.1和图3.1.2。图3.1.1和图3.1.2中的值代表500次模拟的平均STRESS和RDVM。从图3.1.1和图3.1.1可以看出ilr EM和alr EM相比mult R有较小的STRESS和RDVM,然而,mult KM和mult LN相比mult R有较大的STRESS和RDVM。图3.1.2给出了当ρ=0.7和0.9时不同方法在两种评价指标下的趋势。
理论教育 2023-11-17

成分数据零值处理方法-回归分析研究成果

当成分数据中有零值时,对数比率变换将失效,因此在成分数据分析前需对零值进行处理。2016年Templz等针对高维成分数据中的近似零值,提出了一种基于ilr坐标的偏最小二乘回归插补法[63]。
理论教育 2023-11-17

面向成分数据的异方差线性回归参数估计

接下来,分别给出模型中参数的估计和推论。因此,需要通过公式来推导实数空间上异方差回归模型的参数估计。定理5.1.1虑异方差线性回归模型,参数矩阵B的估计量可以通过下面的表达式得到证明参数矩阵和A j之间的关系为基于关系式=G Dj和A j G Dj=A j可得记为估计的参数矩阵,且我们有对上面等式两端分别右乘矩阵U clr WT P T,则由于则等式左边等于B^U ilr WU Tilr,右边等于第一个等号是基于公式得到的。
理论教育 2023-11-17

面向成分数据的参数推论

,A q的估计可以得到,但是很难得到这些参数的推论,主要是由于参数具有约束a 0∈S L,A j 1Dj=0L(j=1,2,…为了解决这个问题,首先研究模型的参数β的推论。将公式中的置换矩阵P代入公式中,很显然检验统计量T 0是不变的。通过定理4.3.1,当l 0和l j固定后,在成分自变量j)的成分任意置换下,参数的推论保持不变。
理论教育 2023-11-17

成分数据坐标表示-面向成分数据的回归分析研究

根据定义1.1.3可知e D,i不是成分数据,因此它不能作为单形上的基。定义2.2.2对于任意成分数据x=(x 1,x 2,…clr变换关于成分是对称的,但是变换后的数据求和为零,与之相对应的协方差矩阵是奇异的。从性质2.2.3可以看出,clr变换可以保证从S D到D-1的等距性,即clr系数间的欧氏距离与原始成分数据间的Aitchison距离相等。矩阵ΨD满足证明下面给出公式的证明。公式两边分别左乘矩阵可得同样公式两边分别右乘ΨD可得因此ΨD是的伪逆矩阵。
理论教育 2023-11-17

面向成分数据的回归分析研究:实例分析成果

类似于模拟分析,我们给出探测范围,将低于探测范围以下的值记为零。实例分析的主要目的是通过不同方法替换近似零值。表3.1.1给出了8种不同的探测范围,其中e j是第j个成分的探测范围。表3.1.1同时也给出了成分u 1,u 3,u 6,u 7的近似零值的比例以及成分数据集U的近似零值的总比例。实例分析结果表明本节所提出的方法在moss数据集上优于已有方法。表3.1.2不同方法在8种探测范围情形下对于成分数据集U插补后的2种评价指标STRESS和RDVM的结果
理论教育 2023-11-17

成分数据的回归分析方法研究

成分数据分析集中在数据分析和统计分析两大方向[30,31,32,33]。在数据分析方面,2010年Hron等提出了新的方法来处理成分数据中的缺失值[34]。除此之外,成分数据中对零值的研究颇多,主要是因为当成分数据中有零值时,对数比率变换将失效,1.2.1节主要介绍已有的处理成分数据零值的方法。2015年Wang等根据成分数据的运算在单形上建立了主成分分析[41]。此外,多元统计分析中还有一种经典且最常用的方法就是回归分析[51,52],1.2.2节详细介绍了基于成分数据的回归分析模型。
理论教育 2023-11-17

成分数据的回归分析研究成果

由于成分数据对应的比例数据具有常数和约束,因此相应的统计分析可能存在困难。ilr变换是等距的,相比于alr变换和clr变换,ilr变换被广泛地应用在成分数据分析中。定义1.1.1当且仅当所有的成分x i(i=1,2,…相对信息指的是成分数据仅有的信息反映在成分间的比率中,而与每个成分的绝对数据是无关的。定义1.1.3成分数据的样本空间是单形,常数和k是任意的正实数,它依赖于测量的单位,通常取1或100。定义1.1.4(子成分)对于成分数据x=(x 1,x 2,…
理论教育 2023-11-17

矩阵乘积运算在单形上的应用

本节介绍一种单形上的线性变换,通过矩阵乘积运算将单形S D上的成分数据映射到S C上的成分数据[85]。定义2.3.1对于任意成分数据x∈S D 2,给定一个D 1×D 2实数矩阵A=[a ij]D 1×D 2,单形上的矩阵乘积定义为单形上的矩阵乘积运算将S D 2上的x变换为S D 1上的Ax。根据性质2.2.3可知又由于因此结合性2的等式成立。
理论教育 2023-11-17

成分数据回归模型研究

下面分别介绍每种类型已有的回归分析模型。2014年Lin等建立了高维成分自变量的回归模型,并提出了变量选择方法[73]。2015年Marzio等针对基于成分因变量的回归分析提出了非参数回归模型[74],其形式为y i=
理论教育 2023-11-17

模拟分析结果表格及评价指标比较

模拟的平均结果见表3.2.1,从表3.2.1中可以看出,随着近似零值的增加,所有方法的CED和RDCM倾向于变大。表3.2.2给出了固定n=50,l=5,变化D=100,200,300,400,500时,100次模拟的平均结果。表3.2.2对于模拟数据集4种方法在不同维数情形下的3种评价指标总而言之,PLS方法有高的计算时间和高的计算精度,var OLS方法有低的计算工作量和低的计算精度。
理论教育 2023-11-17

基于成分数据的偏最小二乘回归模型研究

但是当所有成分自变量的部分数增加时,现有的基于成分变量的线性回归模型不可用。第三种类型在文献[95]中有所研究,该文献提出了在一个成分因变量和一个成分自变量情况下基于clr系数的PLS回归,以及在一个成分因变量和多个成分自变量情况下基于clr系数的分层PLS回归。为了直接得到成分变量间的回归关系,需要研究单形上的PLS回归。本章研究第三种类型的基于成分因变量和成分自变量的偏最小二乘回归模型。
理论教育 2023-11-17

基于成分数据的回归分析研究成果

为了建立单形上的PLS回归,首先需要给出单形上的PLS因子。根据定理6.1.1,w 3是H 2UV T VU T最大特征值相关的单位特征向量,则k T R 3=其中δ是一个任意的实数。注6.2.2当因变量和自变量都是成分数据时,本节提出的单形上的PLS回归需考虑优化问题。因为和所以上面的回归方程没有截距项。,r),因此定理6.2.4与每个clr系数对应于原始成分这个事实一致,即它通过原始成分关于其他成分几何均值的对数比率解释了原始成分的所有相对信息。
理论教育 2023-11-17
-已经加载完成-