理论教育 成分数据回归分析研究结果:不同方法间的模拟分析对比

成分数据回归分析研究结果:不同方法间的模拟分析对比

时间:2023-11-17 理论教育 版权反馈
【摘要】:本小节中我们将进行多种模拟分析。为了描述不同成分之间的多种相关性水平,取ρ=0.3,0.5,0.7和0.9。对于不同的探测范围对应不同的近似零值比率,本节所提出的方法与已有方法效果的比较结果见图3.1.1和图3.1.2。图3.1.1和图3.1.2中的值代表500次模拟的平均STRESS和RDVM。从图3.1.1和图3.1.1可以看出ilr EM和alr EM相比mult R有较小的STRESS和RDVM,然而,mult KM和mult LN相比mult R有较大的STRESS和RDVM。图3.1.2给出了当ρ=0.7和0.9时不同方法在两种评价指标下的趋势。

成分数据回归分析研究结果:不同方法间的模拟分析对比

本小节中我们将进行多种模拟分析。首先,我们用多元正态分布N 4(μ,Σ)模拟样本量为300的实数数据集,成分数据集X则可以通过ilr逆变换得到。假定近似零值是由于观测值低于某个探测范围而产生的,而且不同成分数据相同部分的探测范围是相同的,所以探测范围可以记为一个向量E=[e 1,e 2,…,e 5],其中e j(j=1,2,…,5)是X中第j个成分的αj分位数。

设置均值μ=[-2,-1.5,-1,-0.3],协方差为Σ=[ρ|i-j|]4×4。为了描述不同成分之间的多种相关性水平,取ρ=0.3,0.5,0.7和0.9。构造10种不同的探测范围,其中α1从0.05变到0.5,步长为0.05;α2从0.04变到0.4,步长为0.04;α3从0.03变到0.3,步长为0.03;α4从0.02变到0.2,步长为0.02;α5=0。设置第j个成分中小于e j(j=1,2,3,4)的数据为零值,则第一个成分的近似零值比例大约从5%变到50%,步长为5%;第二个成分的近似零值比例大约从4%变到40%,步长为4%;第三个成分的近似零值比例大约从3%变到30%,步长为3%;第四个成分的近似零值比例大约从2%变到20%,步长为2%;最后一列成分没有近似零值。因此成分数据集对应的近似零值比率大约从2.8%变到28%,步长为2.8%。

对于以上描述的不同设置情况模拟500次。对于不同的探测范围对应不同的近似零值比率,本节所提出的方法与已有方法效果的比较结果见图3.1.1和图3.1.2。图3.1.1和图3.1.2中的值代表500次模拟的平均STRESS和RDVM。图3.1.1(a)和图3.1.1(b)描述ρ=0.3和0.5时不同方法在10种探测范围下的两种评价指标效果。从图3.1.1(a)和图3.1.1(b)可以看出ilr EM和alr EM相比mult R有较小的STRESS和RDVM,然而,mult KM和mult LN相比mult R有较大的STRESS和RDVM。此外,当近似零值比例增加时,mult K的STRESS低于已有方法。在评价指标RDVM上,当ρ=0.3时,mult K方法相比已有方法表现较差;当ρ=0.5时,mult K方法在某些情形下表现较好。图3.1.2给出了当ρ=0.7和0.9时不同方法在两种评价指标下的趋势。从图3.1.2(a)和图3.1.2(b)中我们可以看出mult K方法相比其他方法在两种评价指标STRESS和RDVM上表现较优。ilr EM方法的STRESS值与mult R方法的STRESS值非常接近,然而在评价指标RDVM上,ilr EM方法相比mult R方法表现较差。总的来说,当近似零值比例增加时,本节所提出的方法相比已有方法在两种评价指标STRESS和RDVM上表现较好。

(www.daowen.com)

图3.1.1 当ρ=0.3(a)和ρ=0.5(b)时6种方法(multR,mult KM,mult LN,ilr EM,alr EM,mult K)在10种不同探测范围下的两种评价指标STRESS和RDVM

图3.1.2 当ρ=0.7(a)和ρ=0.9(b)时6种方法(multR,mult KM,mult LN,ilr EM,alr EM,mult K)在10种不同探测范围下的两种评价指标STRESS和RDVM

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈