理论教育 主成分回归法(PCR)优化

主成分回归法(PCR)优化

时间:2023-06-22 理论教育 版权反馈
【摘要】:主成分回归法是采用多元统计中的主成分分析方法,对混合物光谱量测矩阵X进行分解,然后选取其中的主成分来进行多元线性回归分析。如何针对待测物质主要成分进行近红外光谱解析,找到最优定标波长组合用于建立稳健的定标模型,常用的波长选择方法为利用主成分分析结合多元线性回归的建模方法。主成分回归克服了MLR所产生的严重共线性问题,即病态。在主成分回归中,对于模型建立至关重要的便是最佳主成分数的选取。

主成分回归法(PCR)优化

主成分回归法是采用多元统计中的主成分分析方法,对混合物光谱量测矩阵X进行分解,然后选取其中的主成分来进行多元线性回归分析。其核心是主成分分析,将原始数据降维,通过对原变量进行一系列的变换,使少数几个新变量变成原变量的线性组合,与此同时,这些新变量最大限度地表征了被测样品的组成和结构特性,并且最小限度地包含噪声等干扰因素。经转换得到的新变量是相互彼此正交的,即互不相关,以消除大量信息共存时相互重叠而掩盖的信息部分。

如何针对待测物质主要成分进行近红外光谱解析,找到最优定标波长组合用于建立稳健的定标模型,常用的波长选择方法为利用主成分分析结合多元线性回归的建模方法。PCR不是直接考虑yX的回归,而是对X中的信息重新进行综合,提取对系统有最佳解释能力的成分信息。由于对变量系统重新进行了综合,将会克服多重相关性造成的信息重叠问题,同时由于对变量系统中的信息进行了筛选,将有效地区分系统信息和噪声,提高模型的精确度

首先对光谱X进行主成分分解,得到载荷矩阵和得分矩阵:

式中,Tn×f为光谱X的得分,其列变量之间正交;Pp×f为主成分的载荷,其行变量之间正交;Ef为残差;f为主成分数。

然而此时参考浓度并没有起作用,主成分回归法在主成分分析的基础上,将浓度y和X的得分T进行回归:y=TB+E回归系数的最小二乘解如下:(www.daowen.com)

PCR通过合理选择参与回归的主成分,去掉了大部分的噪声。由于T的各列互相正交,解决了多元线性回归中的共线问题。然而在得到的一系列主成分中,某些主成分和浓度之间不一定有相关关系,因此回归结果就不一定合理。

主成分回归克服了MLR所产生的严重共线性问题,即病态。在最大程度利用光谱信息的同时,通过忽略那些次要成分,起到了抑制噪声对模型的影响,进一步提高了校正模型的稳定性和可靠性。该方法不需要了解干扰组分的存在便可以较为准确地测出待测组分。但其运算速度比MLR慢,且不如MLR方法对模型的那么直观。

在主成分回归中,对于模型建立至关重要的便是最佳主成分数的选取。若主成分数过少,将会丢失一定量的有用信息,拟合不充分;若选取的主成分数过多,则会因为包含过多的噪声而出现过度拟合现象,使得模型的预测误差增大。因此,要合理选取最佳主成分数,有效地提高模型的预测性和可靠性。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈