近红外光谱分析是通过对样品光谱和其质量参数进行关联,建立校正模型,然后通过校正模型预测样品的组成和性质的方法,使用数学方法对两者进行关联,可确立这两者间的定量或定性关系,即校正模型。建立模型后,只要测量未知样品的近红外光谱,根据校正模型和样品的近红外光谱就可以预测样品的质量参数。
近红外光谱分析技术主要应用在两个方面:一是近红外光谱的定性判别分析;二是近红外光谱的定量分析。相应地,在近红外光谱分析中的建模方法研究也分为两类:一是近红外定性分析方法研究;二是近红外定量校正方法研究。
定量校正方法多采用各种多元线性校正方法:逐步多元线性回归(Step Multi Linear Regression,SMLR)、主成分回归(Principal Component Regression,PCR)、偏最小二乘回归(Partial Least-Squares Regression,PLSR)、稳健偏最小二乘回归(Robust Partial Least-Squares Regression,RPLSR)等方法。在建立近红外光谱定量校正模型时,通常使用逐步回归分析(SRA)、主成分回归(PCR)及偏最小二乘法(PLS)等建立的样品化学标准值与样品光谱参数之间的模型都是线性的,线性算法对具有内在线性关系的体系的校正能力是很强的,但对于存在非线性关系的体系就会出现预测误差远大于校验误差的现象。但近红外吸收光谱中,光谱参数与样品组分含量的化学标准值之间具有一定的非线性,特别是当样品的含量范围较大时,其非线性较明显。非线性校正算法主要有人工神经网络(Artificial Neural Networks,ANN)、非线性PLS、局部权重回归(Local Weighted Regression,LWR)等方法。ANN方法非线性逼近能力很强,在近红外光谱分析方面的应用已越来越广泛,但ANN方法也存在一些局限性,如训练速度很慢,容易陷入局部极小,也存在过拟合现象及当输入变量间存在共线性时预测能力较差,同时,关于人工神经网络的类型、结构、训练参数、训练样品数目、学习过程等参数的选择大多还是凭经验,还有待于进一步研究。
模式识别最早出现在20世纪20年代,60年代末被引入化学领域。化学模式识别是利用统计学、信号处理、数学算法等工具,从化学量测数据推理出物质类的本质属性,进而对物质进行识别和归类的一门技术。(www.daowen.com)
化学模式识别方法包括聚类分析(Cluster Analysis)、判别分析(Discriminant Analy-sis)、特征投影显示(Latent Projection)等方法。按照有没有训练集可以划分为无监督的模式识别方法(Unsupervised Pattern Recognition)和有监督的模式识别方法(Supervised Pat-tern Recognition)。聚类分析属于无监督的模式识别方法,判别分析属于有监督的模式识别方法,特征投影显示可以是无监督的,也可以是有监督的。
本书针对果蔬的农药残留、植物油品质、小麦粉、淀粉的近红外光谱技术检测进行研究,如何将几种模式识别技术,即PLS、模糊模式识别、ANN、SVM及近红外光谱分析有机地结合,以实现定量和定性分析,旨在找到一种更为有效的近红外光谱的建模方法,为上述农产品的近红外光谱分析提供新思路和新技巧。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。