理论教育 面向成分数据的回归分析研究:实例分析成果

面向成分数据的回归分析研究:实例分析成果

时间:2023-11-17 理论教育 版权反馈
【摘要】:类似于模拟分析,我们给出探测范围,将低于探测范围以下的值记为零。实例分析的主要目的是通过不同方法替换近似零值。表3.1.1给出了8种不同的探测范围,其中e j是第j个成分的探测范围。表3.1.1同时也给出了成分u 1,u 3,u 6,u 7的近似零值的比例以及成分数据集U的近似零值的总比例。实例分析结果表明本节所提出的方法在moss数据集上优于已有方法。表3.1.2不同方法在8种探测范围情形下对于成分数据集U插补后的2种评价指标STRESS和RDVM的结果

面向成分数据的回归分析研究:实例分析成果

在本小节中,前面所提出的方法被应用于Kola project的moss数据,该数据集可从R程序包Stat DA[89]中调用。本小节对前面所提出的方法与已有方法(mult R,mult KM,mult LN,ilr EM和alr EM)进行了比较。Moss数据集包含50多个化学元素和594个样本观测值。我们关注包括7个部分的子成分[Al,Ca,Fe,K,Mg,Na,Si],记为成分数据集U=该数据集的7个成分求和为常数100%,而且没有近似零值。类似于模拟分析,我们给出探测范围,将低于探测范围以下的值记为零。实例分析的主要目的是通过不同方法替换近似零值。

假定成分u 1,u 3,u 6和u 7有近似零值。表3.1.1给出了8种不同的探测范围,其中e j(j=1,3,6,7)是第j个成分的探测范围。表3.1.1同时也给出了成分u 1,u 3,u 6,u 7的近似零值的比例以及成分数据集U的近似零值的总比例。表3.1.2给出了6种方法(mult R,mult KM,mult LN,ilr EM,alr EM,mult K)在8种情形下的两种评价指标STRESS和RDVM的结果。根据表3.1.2,我们能发现本节所提出的方法相比已有方法除了前两种情形外有较小的STRESS值,而且在每种情形下该方法相比已有方法都有较小的RDVM值。此外,当近似零值比例增加时,mult R相比ilr EM和alr EM表现较好。这是因为ilr EM和alr EM都假定了成分数据集的分布。事实上,成分数据集U不服从单形上正态分布[90],该分布可以通过效率检验[91]或基于奇异值分解的检验,例如边缘单变量检验、双变量检验和半径检验[18]。alr EM相比ilr EM有较大的STRESS和RDVM值,这是因为ilr EM是一个稳健的方法,相比alr EM表现较好。实例分析结果表明本节所提出的方法在moss数据集上优于已有方法。

表3.1.1 成分数据集U的8种探测范围情形

续表(www.daowen.com)

注:括号中的值代表对应成分的近似零值比例;最后一列ZR代表对应情形下的近似零值的总比例(%)。

表3.1.2不同方法(multR,mult KM,mult LN,ilr EM,alr EM,mult K)在8种探测范围情形下对于成分数据集U插补后的2种评价指标STRESS和RDVM的结果

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈