理论教育 高维数据回归分析新方法-Q型聚类回归插补

高维数据回归分析新方法-Q型聚类回归插补

时间:2023-11-17 理论教育 版权反馈
【摘要】:然而,后三种方法不能适用于高维成分数据集。当成分数据集中有很多成分,即p是高维的,这个方法有较大的计算量。本节研究高维成分数据中的近似零值插补,提出一种基于Q型聚类的回归插补方法。该方法首先对成分数据的部分进行Q型聚类分析,然后建立某一类子成分与其他类子成分之间的偏最小二乘回归,最后基于EM算法的思想,对某一类子成分中所有近似零值进行插补。

高维数据回归分析新方法-Q型聚类回归插补

目前,有很多方法可以处理近似零值。例如,乘法替换法、乘法对数正态替换方法、基于alr坐标或ilr坐标的修正EM算法、数据扩充算法和Kaplan-Meier法。然而,后三种方法不能适用于高维成分数据集。为了解决这个问题,文献[63]提出了偏最小二乘回归方法和变量选择后基于模型的替换方法。通过乘法替换法对近似零值进行初始化插补后,偏最小二乘回归方法首先将初始有近似零值的部分置换到第一个部分,然后对第一个ilr坐标和剩余ilr坐标建立偏最小二乘回归。假定p个成分有近似零值,这个方法需要使用p次偏最小二乘回归。当成分数据集中有很多成分,即p是高维的,这个方法有较大的计算量。虽然变量选择后基于模型的替换方法能减少计算复杂度,但是计算精度不高。

本节研究高维成分数据中的近似零值插补,提出一种基于Q型聚类的回归插补方法。该方法首先对成分数据的部分进行Q型聚类分析,然后建立某一类子成分与其他类子成分之间的偏最小二乘回归,最后基于EM算法的思想,对某一类子成分中所有近似零值进行插补。在偏最小二乘回归中,因变量为子成分的对称对数比率系数或等距对数比率坐标能得到等价的结果,即能得到相同的近似零值插补值。最后在模拟数据集和实际数据集上,通过三种评价指标来比较本节提出的方法相比已有近似零值替换方法的表现,结果表明本节提出的方法在高维时能提高时间效率和计算精度。本节的主要目的是提出一种新的方法来提高时间效率和计算精度,并通过模拟分析和实际例子来比较该方法和已有方法[92]。(www.daowen.com)

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈