PLS通过因子分析将光谱(多维空间数据,维数相当于波长数目)压缩为较低维空间数据,其方法是将光谱数据向协方差最大方向投影。将原近红外光谱分解为多种主成分光谱,不同近红外光谱的主成分分别代表不同组分和因素对光谱的贡献,通过对主成分的合理选取,去掉代表干扰组分和干扰因素主成分,仅选取有用的主成分参与质量参数的回归。较适合分析微量成分。
偏最小二乘法也是一种多元回归算法。类似PCR,对光谱矩阵X进行分解,去除其中无效的噪声干扰。同时,分解浓度矩阵Y,消除其中的无用信息。并且,在分解光谱矩阵X的同时考虑了浓度矩阵Y的影响,其实质是将矩阵分解和回归并为一步。在每计算一个新主成分之前,将X的得分矩阵T与矩阵Y的得分U矩阵进行交换,使得到X主成分直接与Y关联。这样就弥补了PCR方法只针对X进行分解的缺点。
PLS算法如下所示:
PLS首先对光谱矩阵X和浓度矩阵Y进行分解,其模型如式(2-38)和式(2-39)所示:
X=TP+E (2-38)
Y=UQ+F (2-39)
其中,T是X矩阵的得分矩阵;U是Y矩阵的得分矩阵;P是X矩阵的载荷矩阵;Q是Y矩阵的载荷矩阵;E是X矩阵的PLS拟合残差矩阵;F是Y矩阵的PLS拟合残差矩阵。
PLS第二步是将T和U做线性回归,如式(2-40)和式(2-41)所示:
U=TB (2-40)
T=(TTT)-1TTY (2-41)(www.daowen.com)
在预测时,首先根据P求出未知样品光谱矩阵X未知的得分矩阵T未知,然后求得浓度预测值,如式(2-42)所示:
Y未知=T未知BQ (2-42)
PLS在应用中显示出了其独特的优越性:
1)灵活地使用光谱数据,可以根据需要使用全部或者部分光谱数据而达到很好的建模效果。
2)将特征矢量与被测成分相关,即把数据分解与回归同时进行,有效地融合在一起。
3)适用于处理样品数量少,但是变量相对较多的问题。
4)PLS是多元线性回归和主成分分析的完美结合,显著提高了校正模型的预测能力。
正因为PLS的如上优点,在很多领域中,该方法得到了广泛的应用。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。