在近红外光谱分析的建模中,经常遇到处理多个光谱信息与所研究质量参数的相关性,多元线性回归(MLR)分析是最早使用的统计分析方法。多元线性回归是一元线性回归的扩展,又称为逆最小二乘法,用于建立自变量和因变量之间的关系。MLR只要求已知定标样品待测特征成分的含量值,选择若干个光谱点的吸光度值与该特征成分含量进行线性回归即可得到定标模型的回归系数。要选择好对应于被测特征成分的数据矢量。
设在近红外光谱分析中校正集样品数为n,样品成分数为p,选定的近红外光谱数为m,在多元线性回归分析中,总是假设校正集样品数大于光谱数,即n>m。光谱矩阵为Xn×m,成分含量矩阵为Yn×p,测量误差矩阵为En×p,则有关系式:
式(2-34)是由已知样品的成分含量矩阵Yn×p和光谱矩阵Xn×m,求Bm×p的过程为校正;将Bm×p代回式(2-33)中,则式(2-33)为该样品集的数学模型。通过校正过程计算得到Bm×p,再利用式(2-33)通过未知样品的近红外光谱计算未知浓度作为预测。其中Yn×p={yij}(i=1,2,…,n,j=1,2,…,p);Xn×m={aik}(i=1,2,…,n,k=1,2,…,m)。(www.daowen.com)
对于单成分分析,p=1,则式(2-33)可简化为
多元线性回归法比较适合线性较好的数据,由质量参数之间相互干扰带来的影响可以不考虑,而且公式含义清楚,计算简单,对数据矢量较少的体系回归效果较好。其局限性是不能够解决光谱矩阵的共线性问题以及对线性不好的数据回归效果较差,所建模型的预测能力较差。而且波长点数不应该超过校正集的样品数目,这样难免会损失一些有效的光谱信息;吸光度矩阵存在共线性问题,导致其成为病态矩阵;此外,运算过程中没有考虑到存在的噪声,这样同样会导致过拟合情况,从而降低了模型的可靠性。因此,MLR在近红外光谱早期应用中较为广泛,为了建立更为稳健的模型,人们逐渐在此基础上发展出一系列更为有效的算法。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。