理论教育 卷烟材料影响有害成分预测模型的建立

卷烟材料影响有害成分预测模型的建立

时间:2023-06-16 理论教育 版权反馈
【摘要】:近年来的研究表明:卷烟材料对烟气特征的影响有其内在的规律性。表6-1 多因素样品设计表续表续表三、模型的建立与优化采用线性回归法和逐步回归法,分别建立了烟用材料设计参数对主流烟气中7种有害成分、烟碱、焦油释放量的多因素预测模型。

卷烟材料影响有害成分预测模型的建立

卷烟材料的合理组合即“三纸一棒”(成型纸、接装纸、卷烟纸和滤棒)是当前烟草企业最易实现的有效降焦减害方法之一。近年来的研究表明:卷烟材料对烟气特征的影响有其内在的规律性。“卷烟减害技术”重大专项提出最具代表性的7种卷烟烟气有害成分,即CO、HCN、NNK、NH3、苯并 [a]芘、苯酚巴豆醛,并以卷烟烟气危害性指数H来表征卷烟主流烟气的危害性,为行业减害降焦技术研究的深入开展提供了参考依据。为了实现在卷烟辅材设计的关键环节中对卷烟主流烟气中的有害成分、烟碱、焦油释放量化学成分释放量进行预测,辅助控制这些指标在标准规定的范围内,同时确保卷烟产品的质量,根据近年来卷烟烟用材料设计实验测定的主流烟气中有害成分、烟碱、焦油释放量成分释放量的检测数据,采用线性回归法和逐步回归法分别建立卷烟烟用材料参数对主流烟气中有害成分、烟碱、焦油释放量化学成分释放量的多因素预测模型,估计出了模型的系数,并根据交叉验证和外部验证的结果对模型进行优化,不断提高预测的精度,为低焦油、低危害产品的开发提供了数字模拟技术。

一、烟用材料设计参数及预测指标

共计5个烟用材料设计参数,分别为卷烟纸定量(X1)、卷烟纸透气度(X2)、成形纸透气度(X3)、接装纸透气度(X4)和滤棒压降(X5)。预测指标共计9个:CO、HCN、NNK、NH3、苯并 [a] 芘、苯酚、巴豆醛、烟碱和焦油。

二、卷烟样品设计

选取卷烟纸透气度、卷烟纸定量、接装纸透气度、成形纸透气度、滤棒压降5个因素,每个因素5个水平,采用中心组合结合正交设计制备了烤烟型和混合型卷烟各50个样品(表6-1)。

表6-1 多因素样品设计表

续表

续表

三、模型的建立与优化

采用线性回归法和逐步回归法,分别建立了烟用材料设计参数对主流烟气中7种有害成分、烟碱、焦油释放量的多因素预测模型。预测模型建立采用了多因素设计的50个样品,并对所建模型进行95%置信水平P检验,并依据交叉验证标准差RMSECV筛选出最优预测模型。

1. 烟碱预测模型

烟碱的烤烟型预测模型建立采用了多因素设计的50个样品,释放量范围:0.4~1.1mg/支,建立预测模型过程如下:

(1)模型1:5因素线性模型 采用多元线性回归法建立了烟碱与5项指标的预测模型,模型及模型参数如下:

Y=1.506-0.0009423X1-0.002199X2-7.100E-6X3-0.0003532X4-8.845E-5X5

如表6-2所示,模型1中X1的系数P为0.6326,说明本模型中X1系数的可靠性稍差,但由表6-3可知,模型1的P小于0.05,决定系数 R2为0.9308,说明模型1能够通过检验,有统计学意义。

表6-2 烟碱模型1回归系数P检验

表6-3 烟碱模型1性能指标

如图6-3所示,根据模型1计算的拟合值与实际测定值的线性相关线斜率为0.997,R2为0.9259,说明模型1拟合值与实测值吻合度较好。由拟合误差图6-4可知,拟合值与观测值之间的误差大多分布在± 0.15mg/支这个范围内,且没有任何趋势,说明建立的模型是好的。

图6-3 烟碱模型1内部验证图

图6-4 烟碱模型1内部验证残差图

(2)模型2:5因素二次多项式模型 采用逐步回归法建立了烟碱与5项指标及其交叉项和二次项的预测模型,模型及模型参数如下:

Y=0.5234-0.005857X2-0.0006599X4+0.0004133X5+0.00004175X2X2+0.0000001191X4X4-0.00000006192X5X5-0.00000003756X2X3-0.00000001420X3X4+0.00000006745X4X5

如表6-4所示,模型2各系数P均小于0.05,说明模型2的各系数能够通过检验。由表6-5可知,模型2的P<0.05,决定系数R2为0.9660,说明模型2能够通过检验,有统计学意义。

表6-4 烟碱模型2回归系数P检验

表6-5 烟碱模型2性能指标

如图6-5所示,根据模型2计算的拟合值与实际测定值的线性相关线斜率为0.9971,R2为0.9134,说明模型2拟合值与实测值吻合度较好。由拟合误差图6-6可知,拟合值与观测值之间的误差大多分布在± 0.15mg/支这个范围内,且没有任何趋势,说明建立的模型是好的。

图6-5 烟碱模型2内部验证图

图6-6 烟碱模型2内部验证残差图

(3)模型3:5因素多因子及互作项模型 采用逐步回归法建立了烟碱与5项指标及其交叉项的预测模型,模型及模型参数如下:

Y=1.008+0.00006660X1X2-0.000006254X1X4-0.0000009709X2X4-0.0000008768X2X5-0.00000001276X3X4

从表6-6看出,模型3中 X2X4的系数P值为0.1806,说明本模型中X2X4系数的可靠性稍差,但由表6-7可知,模型3的P值小于0.05,决定系数R2为0.9182,说明模型3能够通过检验,有统计学意义。

表6-6 烟碱模型3回归系数P检验

表6-7 烟碱模型3性能指标

由图6-7可知,根据模型3计算的拟合值与实际测定值的线性相关线斜率为0.997,R2为0.9111,说明模型3拟合值与实测值吻合度较好。由拟合误差图6-8可知,拟合值与观测值之间的误差大多分布在± 0.15mg/支这个范围内,且没有任何趋势,说明建立的模型是好的。

图6-7 烟碱模型3内部验证图

图6-8 烟碱模型3内部验证残差图

单因素试验结果表明,烟碱释放量与卷烟纸定量之间基本无关,因此对其余四因素建立预测模型。

(4)模型4:4因素线性模型 采用多元线性回归法建立了烟碱与4项指标的预测模型,模型及模型参数如下:

Y=1.279-0.002181X2-0.000004320X3-0.0003177X4-0.00005397X5

如表6-8所示,模型4各系数P值均小于0.05,说明模型4的各系数能够通过检验。如表6-9所示,模型4的P<0.05,决定系数R2为0.8885,说明模型4能够通过检验,有统计学意义。

表6-8 烟碱模型4回归系数P检验

表6-9 烟碱模型4性能指标

如图6-9所示,根据模型4计算的拟合值与实际测定值的线性相关线斜率为0.996,R2为0.875,说明模型4拟合值与实测值吻合度较好。由拟合误差图6-10可知,拟合值与观测值之间的误差大多分布在± 0.15mg/支这个范围内,且没有任何趋势,说明建立的模型是好的。

图6-9 烟碱模型4内部验证图

图6-10 烟碱模型4内部验证残差图

(5)模型5:4因素二次多项式模型 采用逐步回归法建立了烟碱与4项指标及其交叉项和二次项的预测模型,模型及模型参数如下:

Y=1.208-0.0003734X4-0.00004730X5+0.00000005514X4X4-0.000001085X2X4-0.0000004085X2X5-0.00000001362X3X4+0.00000003552X4X5

从表6-10看出,模型5中X4X4X2X4X4X5的系数P>0.05,说明本模型中X4X4X2X4X4X5系数的可靠性稍差,但由表6-11可知,模型5的P<0.05,决定系数R2为0.9225,说明模型5能够通过检验,有统计学意义。

表6-10 烟碱模型5回归系数P检验

表6-11 烟碱模型5性能指标

由图6-11可知,根据模型5计算的拟合值与实际测定值的线性相关线斜率为0.9966,R2为0.9141,说明模型5拟合值与实测值吻合度较好。由拟合误差图6-12可知,拟合值与观测值之间的误差大多分布在± 0.1mg/支这个范围内,且没有任何趋势,说明建立的模型是好的。

图6-11 烟碱模型5内部验证图

图6-12 烟碱模型5内部验证残差图

(6)烟碱预测模型优选 通过P检验的烟碱预测模型共计5个,各预测模型参数见表6-12。从表中看出,5个模型的R2均在0.9以上,其中模型2的R2最大,交叉验证标准差RMSECV值最小,因此选择模型2作为烟碱最优预测模型。

表6-12 烟碱预测模型

2. 焦油预测模型

焦油的烤烟型预测模型建立采用了单因素和多因素设计的88个样品,释放量范围:4.3~15.3mg/支,建立预测模型过程如下:

(1)模型1:5因素线性模型 采用多元线性回归法建立了焦油与5项指标的预测模型,模型及模型参数如下:

Y=20.35+0.001426X1-0.03542X2-0.0001272X3-0.005745X4-0.001246X5

如表6-13所示,模型1中X1的系数P=0.9625,说明本模型中X1系数的可靠性稍差,但由表6-14可知,模型1的P值<0.05,决定系数 R2为0.9517,说明模型1能够通过检验,有统计学意义。

表6-13 焦油模型1回归系数P检验

表6-14 焦油模型1性能指标

由图6-13可知,根据模型1计算的拟合值与实际测定值的线性相关线斜率为0.9967,R2为0.9494,说明模型1拟合值与实测值吻合度较好。由拟合误差6-14图可知,拟合值与观测值之间的误差大多分布在± 1.5mg/支这个范围内,且没有任何趋势,说明建立的模型是好的。

图6-13 焦油模型1内部验证图

图6-14 焦油模型1内部验证残差图

(2)模型2:5因素二次多项式模型 采用逐步回归法建立了焦油与5项指标及其交叉项和二次项的预测模型,模型及模型参数如下:

Y=22.39-0.08190X2-0.01201X4-0.001451X5+0.0004575X2X2+0.00000001125X3X3+0.000002633X4X4-0.000005439X1X3-0.000001393X2X3+0.00002932X2X4-0.0000001907X3X4+0.0000008406X4X5

如表6-15所示,模型2各系数P值均小于0.05,说明模型2的各系数能够通过检验。如表6-16所示,模型2的P<0.05,决定系数R2为0.9836,说明模型2能够通过检验,有统计学意义。

表6-15 焦油模型2回归系数P检验

表6-16 焦油模型2性能指标

如图6-15所示,根据模型2计算的拟合值与实际测定值的线性相关线斜率为0.9989,R2为0.9833,说明模型2拟合值与实测值吻合度较好。由拟合误差6-16图可知,拟合值与观测值之间的误差大多分布在± 1mg/支这个范围内,且没有任何趋势,说明建立的模型是好的。

图6-15 焦油模型2内部验证图

图6-16 焦油模型2内部验证残差图

(3)模型3:5因素多因子及互作项模型 采用逐步回归法建立了焦油与5项指标及其交叉项的预测模型,模型及模型参数如下:

Y=19.28-0.00009315X3-0.0084X4-0.0009619X5+0.00001839X2X4-0.00001010X2X5-0.0000001012X3X4+0.0000005786X4X5

从表6-17看出,模型3中X2X4X4X5的系数P为>0.05,说明本模型中X2X4X4X5系数的可靠性稍差,但由表6-18可知,模型3的P<0.05,决定系数R2为0.9601,说明模型3能够通过检验,有统计学意义。

表6-17 焦油模型3回归系数P检验

表6-18 焦油模型3性能指标

由图6-17可知,根据模型3计算的拟合值与实际测定值的线性相关线斜率为0.9972,R2为0.9585,说明模型3拟合值与实测值吻合度较好。由拟合误差图6-18可知,拟合值与观测值之间的误差大多分布在± 1.5mg/支这个范围内,且没有任何趋势,说明建立的模型是好的。

图6-17 焦油模型3内部验证图

图6-18 焦油模型3内部验证残差图

单因素试验结论表明,焦油释放量与卷烟纸克重基本无关,因此对其余4个因素建立预测模型。

(4)模型4:4因素线性模型 采用多元线性回归法建立了焦油与4项指标的预测模型,模型及模型参数如下:

Y=20.31-0.03540X2-0.0001272X3-0.005745X4-0.001247X5

如表6-19所示,模型4各系数P均小于0.05,说明模型4的各系数能够通过检验。如表6-20所示,模型4的P<0.05,决定系数R2为0.9517,说明模型4能够通过检验,有统计学意义。

表6-19 焦油模型4回归系数P检验

表6-20 焦油模型4性能指标

由图6-19可知,根据模型4计算的拟合值与实际测定值的线性相关线斜率为0.9967,R2为0.9494,说明模型4拟合值与实测值吻合度较好。由拟合误差图可知,拟合值与观测值之间的误差大多分布在± 1.5mg/支这个范围内,且没有任何趋势,说明建立的模型是好的。

图6-19 焦油模型4内部验证图

图6-20 焦油模型4内部验证残差图

(5)模型5:4因素二次多项式模型 采用逐步回归法建立了焦油与4项指标及其交叉项和二次项的预测模型,模型及模型参数如下:

Y=22.26-0.07651X2-0.0001846X3-0.01117X4-0.001445X5+0.0003995X2X2+0.00000001149X3X3+0.000002648X4X4-0.0000009509X2X3+0.00002327X2X4-0.0000001964X3X4+0.0000007153X4X5

如表6-21所示,模型5中X2X3的系数P=0.1195,说明本模型中X2X3系数的可靠性稍差,但如表6-22所示,模型5的P<0.05,决定系数R2为0.9826,说明模型5能够通过检验,有统计学意义。

表6-21 焦油模型5回归系数P检验

表6-22 焦油模型5性能指标

如图6-21所示,根据模型5计算的拟合值与实际测定值的线性相关线斜率为0.9988,R2为0.9823,说明模型5拟合值与实测值吻合度较好。由拟合误差图6-22可知,拟合值与观测值之间的误差大多分布在± 1.5mg/支这个范围内,且没有任何趋势,说明建立的模型是好的。

(6)焦油预测模型优选 通过P检验的焦油预测模型共计5个,各预测模型参数见表6-23。从表中看出,5个模型的R2均在0.9以上,说明5个模型回归效果很好,其中模型2的R2最大,交叉验证标准差RMSECV值最小,因此选择模型2作为焦油最优预测模型。

图6-21 焦油模型5内部验证图

图6-22 焦油模型5内部验证残差图

表6-23 焦油预测模型

3. 一氧化碳预测模型

一氧化碳的烤烟型预测模型建立采用了单因素和多因素设计的88个样品,释放量范围:4.3~18.3mg/支,建立预测模型过程如下:

(1)模型1:5因素线性模型 采用多元线性回归法建立了一氧化碳与5项指标的预测模型,模型及模型参数如下:

Y=16.75+0.1202X1-0.05884X2-0.0001602X3-0.007204X4-0.0005313X5

如表6-24所示,模型1的各系数P均小于0.05,说明模型1的各系数能够通过检验。如表6-25所示,模型1的P<0.05,决定系数R2为0.9388,说明模型1能够通过检验,有统计学意义。

表6-24 CO模型1回归系数P检验

表6-25 CO模型1性能指标

由图6-23可知,根据模型1计算的拟合值与实际测定值的线性相关线斜率为0.9945,R2为0.9352,说明模型1拟合值与实测值吻合度较好。由残差图6-24可知,拟合值与观测值之间的误差大多分布在± 1.5mg/支这个范围内,且没有任何趋势,说明建立的模型是好的。

图6-23 CO模型1内部验证图

图6-24 CO模型1内部验证残差图

(2)模型2:5因素二次多项式模型 采用逐步回归法建立了一氧化碳与5项指标及其交叉项和二次项的预测模型,模型及模型参数如下:

Y=11.34+0.2503X1-0.009874X4+0.00000001083X3X3+0.000003930X4X4-0.000007910X1X3-0.0002216X1X4+0.00003626X2X4-0.00001644X2X5-0.0000002398X3X4+0.000001206X4X5

如表6-26所示,模型2各系数P均小于0.05,说明模型2的各系数能够通过检验,如表6-27所示,模型2的P<0.05,决定系数R2为0.9752,说明模型2能够通过检验,有统计学意义。

表6-26 CO模型2各回归系数P检验

表6-27 CO模型2性能指标

如图6-25所示,根据模型2计算的拟合值与实际测定值的线性相关线斜率为0.9978,R2为0.9746,说明模型2拟合值与实测值吻合度较好。由拟合误差图6-26可知,拟合值与观测值之间的误差大多分布在± 1.0mg/支这个范围内,且没有任何趋势,说明建立的模型是好的。

图6-25 CO模型2内部验证图

图6-26 CO模型2内部验证残差图

(3)模型3:5因素多因子及互作项模型 采用逐步回归法建立了一氧化碳与5项指标及其交叉项的预测模型,模型及模型参数如下:

Y=12.86+0.1660X1-0.006211X4-0.0002010X1X4-0.000001918X2X3+0.00004198X2X4-0.00001405X2X5-0.0000001584X3X4+0.0000009256X4X5

如表6-28所示,模型3各系数P均小于0.05,说明模型3的各系数能够通过检验,如表6-29所示,模型3的P<0.05,决定系数R2为0.9534,说明模型3能够通过检验,有统计学意义。

表6-28 CO模型3各回归系数P检验

表6-29 CO模型3性能指标

如图6-27所示,根据模型3计算的拟合值与实际测定值的线性相关线斜率为0.9958,R2为0.9514,说明模型3拟合值与实测值吻合度较好。由拟合误差图6-28可知,拟合值与观测值之间的误差大多分布在± 1.5mg/支这个范围内,且没有任何趋势,说明建立的模型是好的。

图6-27 CO模型3内部验证图

图6-28 CO模型3内部验证残差图

(4) CO预测模型优选 通过P检验的一氧化碳预测模型共计3个,各预测模型参数见表6-30。从表中看出,3个模型的R2均在0.9以上,说明3个模型回归效果很好,其中模型2的R2最大,交叉验证标准差RMSECV值最小,因此选择模型2作为一氧化碳最优预测模型。

表6-30 一氧化碳预测模型

4. NNK预测模型

NNK的烤烟型预测模型建立采用了单因素和多因素设计的88个样品,释放量范围:1.4~4.4ng/支,建立预测模型过程如下:

(1)模型1:5因素线性模型 采用多元线性回归法建立了NNK与5项指标的预测模型,模型及模型参数如下:

Y=8.617-0.08538X1-0.0006251X2-6.159E-5X3-0.0007446X4-0.0005918X5

如表6-31所示,模型1各系数P均小于0.05,说明模型1的各系数能够通过检验,如表6-32所示,模型1的P<0.05,决定系数R2为0.4984。尽管模型1的决定系数较低,但是P<0.05,说明模型1具有一定的统计学意义。

表6-31 NNK模型1回归系数P检验

表6-32 NNK模型1性能指标

如图6-29所示,根据模型1计算的拟合值与实际测定值的线性相关线斜率为0.4984,R2为0.4984,由残差图6-30可知,拟合值与观测值之间的误差大多分布在±1.5ng/支这个范围内,说明模型1具备一定的预测能力,但预测效果一般。

图6-29 NNK模型1内部验证图

图6-30 NNK模型1内部验证残差图

(2)模型2:5因素二次多项式模型 采用逐步回归法建立了NNK与5项指标及其交叉项和二次项的预测模型,模型及模型参数如下:

Y=5.977-0.0001942X3+0.000000008991X3X3-0.00002029X1X4-0.00001712X1X5

如表6-33所示,模型2各系数P均小于0.05,说明模型2的各系数能够通过检验,由表6-34可知,模型2的P<0.05,决定系数R2为0.4725。尽管模型2的决定系数较低,但是P<0.05,说明模型2具有一定的统计学意义。

表6-33 NNK模型2回归系数P检验

表6-34 NNK模型2性能指标

如图6-31所示,根据模型2计算的拟合值与实际测定值的线性相关线斜率为0.4725,R2为0.4725,由残差图6-32可知,拟合值与观测值之间的误差大多分布在±1.5ng/支这个范围内,说明模型2具备一定的预测能力,但预测效果一般。

图6-31 NNK模型2内部验证图

图6-32 NNK模型2内部验证残差图

(3)模型3:5因素多因子及互作项模型 采用逐步回归法建立了NNK与5项指标及其交叉项的预测模型,模型及模型参数如下:

Y=5.809-0.00005117X3-0.00002535X1X4-0.00001794X1X5

如表6-35所示,模型3各系数P均小于0.05,说明模型3的各系数能够通过检验,如表6-36所示,模型3的P<0.05,决定系数R2为0.4294。尽管模型3的决定系数较低,但是P<0.05,说明模型3具有一定的统计学意义。

表6-35 NNK模型3回归系数P检验

表6-36 NNK模型3性能指标

由图6-33可知,根据模型3计算的拟合值与实际测定值的线性相关线斜率为0.4294,R2为0.4294,由残差图6-34可知,拟合值与观测值之间的误差大多分布在±1.5ng/支这个范围内,说明模型3具备一定的预测能力,但预测效果一般。

图6-33 NNK模型3内部验证图

图6-34 NNK模型3内部验证残差图

根据单因素试验结论,NNK释放量与卷烟纸克重无关,因此对其余四个因素分别建立了线性模型和二次多项式模型。

(4)模型4:4因素线性模型 采用多元线性回归法建立了NNK与4项指标的预测模型,模型及模型参数如下:

Y=6.326+0.000393X2-0.00005247X3-0.0007721X4-0.0006544X5

如表6-37所示,模型4中X2的系数P为0.9379,说明本模型中X2系数的可靠性稍差,如表6-38所示,模型4的P<0.05,决定系数R2为0.3782,尽管模型4的决定系数较低,但是P<0.05,说明模型4具有一定的统计学意义。

如图6-35所示,根据模型4计算的拟合值与实际测定值的线性相关线斜率为0.3782,R2为0.3781,由残差图6-36可知,拟合值与观测值之间的误差大多分布在±1.5ng/支这个范围内,说明模型4具备一定的预测能力,但预测效果一般。

表6-37 NNK模型4回归系数P检验

表6-38 NNK模型4性能指标

图6-35 NNK模型4内部验证图

图6-36 NNK模型4内部验证残差图

(5)模型5:4因素二次多项式模型 采用逐步回归法建立了NNK与4项指标及其交叉项和二次项的预测模型,模型及模型参数如下:

Y=-18.01-0.0001963X3+0.01085X5+0.000000008985X3X3-0.000001331X5X5-0.0000001305X4X5

如表6-39所示,模型5各系数P均小于0.05,说明模型5的各系数能够通过检验,如表6-40所示,模型5的P<0.05,决定系数R2为0.4358。尽管模型5的决定系数较低,但是P<0.05,说明模型5具有一定的统计学意义。

表6-39 NNK模型5回归系数P检验

表6-40 NNK模型5性能指标

如图6-37所示,根据模型5计算的拟合值与实际测定值的线性相关线斜率为0.4358,R2为0.4358,由残差图6-38可知,拟合值与观测值之间的误差大多分布在±1.5ng/支这个范围内,说明模型5具备一定的预测能力,但预测效果一般。

图6-37 NNK模型5内部验证图

图6-38 NNK模型5内部验证图

(6) NNK预测模型优选 通过P检验的NNK预测模型共计5个,各预测模型参数见表6-41。从表中看出,5个模型的R2均较小,说明5个模型回归效果较差,这可能是由于烤烟型卷烟NNK释放量较小,测试误差相对较大的原因。其中模型1的R2最大,RMSECV值最小,因此选择模型1作为NNK最优预测模型。

表6-41 NNK预测模型

5. 氨预测模型

NH3的烤烟型预测模型建立采用了单因素和多因素设计的88个样品,释放量范围:2.7~9.7μg/支,建立预测模型过程如下:(www.daowen.com)

(1)模型1:5因素线性模型 采用多元线性回归法建立了氨与5项指标的预测模型,模型及模型参数如下:

Y=14.21-0.04198X1-0.01451X2-7.309E-5X3-0.002923X4-0.0009585X5

如表6-42所示,模型1中X1的系数P为0.106,说明本模型中X1系数的可靠性稍差,但如表6-43所示,模型1的P<0.05,决定系数R2为0.8567,说明模型1能够通过检验,有统计学意义。

表6-42 NH3模型1回归系数P检验

表6-43 NH3模型1性能指标

如图6-39所示,根据模型1计算的拟合值与实际测定值的线性相关线斜率为0.9925,R2为0.8339,说明模型1拟合值与实测值吻合度较好。由拟合误差图6-40可知,拟合值与观测值之间的误差大多分布在± 1.5μg/支这个范围内,且不具有一定趋势,说明建立的模型是好的。

图6-39 NH3模型1内部验证图

图6-40 NH3模型1内部验证残差图

(2)模型2:5因素二次多项式模型 采用逐步回归法建立了氨与5项指标及其交叉项和二次项的预测模型,模型及模型参数如下:

Y=11.43-0.005619X4-0.0000001577X5X5-0.0004755X1X2-0.0000006914X1X3-0.0000001638X3X4+0.0000009289X4X5

如表6-44所示,模型2中X1X3的系数P为0.1629,说明本模型中X1X3系数的可靠性稍差,但由表6-45可知,模型2的P<0.05,决定系数R2为0.9041,说明模型2能够通过检验,有统计学意义。

表6-44 NH3模型2回归系数P检验

表6-45 NH3模型2性能指标

如图6-41所示,根据模型2计算的拟合值与实际测定值的线性相关线斜率为0.995,R2为0.8945,说明模型2拟合值与实测值吻合度较好。由拟合误差图6-42可知,拟合值与观测值之间的误差大多分布在± 1μg/支这个范围内,且不具有一定趋势,说明建立的模型是好的。

图6-41 NH3模型2内部验证图

图6-42 NH3模型2内部验证残差图

(3)模型3:5因素多因子及互作项模型 采用逐步回归法建立了氨与5项指标及其交叉项的预测模型,模型及模型参数如下:

Y=14.28-0.005609X4-0.001346X5-0.0004749X1X2-0.0000007123X1X3-0.0000001623X3X4+0.0000009224X4X5

如表6-46所示,模型3中X1X3的系数P为0.1529,说明本模型中X1X3系数的可靠性稍差,但如表6-47所示,模型3的P<0.05,决定系数R2为0.9030,说明模型3能够通过检验,有统计学意义。

表6-46 NH3模型3回归系数P检验

表6-47 NH3模型3性能指标

如图6-43所示,根据模型3计算的拟合值与实际测定值的线性相关线斜率为0.9949,R2为0.8931,说明模型3拟合值与实测值吻合度较好。由拟合误差图6-44可知,拟合值与观测值之间的误差大多分布在± 1μg/支这个范围内,且不具有一定趋势,说明建立的模型是好的。

图6-43 NH3模型3内部验证图

图6-44 NH3模型3内部验证残差图

(4)氨预测模型优选 通过P检验的氨预测模型共计3个,各预测模型参数见表6-48。从表中看出,从表中看出,模型2的R2最大,交叉验证标准差RMSECV值最小,因此选择模型2作为氨最优预测模型。

表6-48 NH3预测模型

6. 氢氰酸预测模型

HCN的烤烟型预测模型建立采用了单因素和多因素设计的88个样品,释放量范围:29.4~193.6μg/支,建立预测模型过程如下:

(1)模型1:5因素线性模型 采用多元线性回归法建立了氢氰酸与5项指标的预测模型,模型及模型参数如下:

Y=222.9+0.5910X1-0.6239X2-0.001570X3-0.08922X4-0.01270X5

如表6-49所示,模型1中X1的系数b1P为0.2919,说明本模型中X1系数的可靠性稍差,但如表6-50所示,模型1的P<0.05,决定系数R2为0.9122,说明模型1能够通过检验,有统计学意义。

表6-49 HCN模型1回归系数P检验

表6-50 HCN模型1性能指标

如图6-45所示,根据模型1计算的拟合值与实际测定值的线性相关线斜率为0.9884,R2为0.9048,说明模型1拟合值与实测值吻合度较好。由拟合误差图6-46可知,拟合值与观测值之间的误差大多分布在± 20μg/支这个范围内,且不具有一定趋势,说明建立的模型是好的。

图6-45 HCN模型1内部验证图

图6-46 HCN模型1内部验证图

(2)模型2:5因素二次多项式模型 采用逐步回归法建立了氢氰酸与5项指标及其交叉项和二次项的预测模型,模型及模型参数如下:

Y=226.3-0.1881X4-0.006251X5+0.0007642X2X4-0.0002207X2X5-0.000001835X3X4-0.0000002256X3X5+0.00001747X4X5

如表6-49所示,模型2中X5的系数P为0.1549,说明本模型中X5系数的可靠性稍差,但如表6-52所示,模型2的P<0.05,决定系数R2为0.9346,说明模型2能够通过检验,有统计学意义。

表6-51 HCN模型2回归系数P检验

表6-52 HCN模型2性能指标

如图6-47所示,根据模型2计算的拟合值与实际测定值的线性相关线斜率为0.9913,R2为0.9507,说明模型2拟合值与实测值吻合度较好。由拟合误差图6-48可知,拟合值与观测值之间的误差大多分布在± 20μg/支这个范围内,且没有任何趋势,说明建立的模型是好的。

图6-47 HCN模型2内部验证图

图6-48 HCN模型2内部验证残差图

(3)模型3:5因素多因子及互作项模型 采用逐步回归法建立了氢氰酸与5项指标及其交叉项的预测模型,模型及模型参数如下:

Y=226.3-0.1881X4-0.006251X5+0.0007642X2X4-0.0002207X2X5-0.000001835X3X4-0.0000002256X3X5+0.00001747X4X5

如表6-53所示,模型3中X5的系数P为0.1549,说明本模型中X5系数的可靠性稍差,但如表6-54所示,模型3的P<0.05,决定系数R2为0.9346,说明模型3能够通过检验,有统计学意义。

表6-53 HCN模型3回归系数P检验

表6-54 HCN模型3性能指标

如图6-49所示,根据模型3计算的拟合值与实际测定值的线性相关线斜率为0.9913,R2为0.9507,说明模型3拟合值与实测值吻合度较好。由拟合误差图6-50可知,拟合值与观测值之间的误差大多分布在± 20μg/支这个范围内,且没有任何趋势,说明建立的模型是好的。

图6-49 HCN模型3内部验证图

图6-50 HCN模型3内部验证残差图

可以看出,模型2和模型3是一致的,这是由于在做二次多项式回归计算过程中各因素的平方项影响较小而被剔除,因此导致模型2和模型3一致。

根据单因素试验结论,卷烟纸定量对HCN释放量基本无影响,因此对其余四个因素建立预测模型。

(4)模型4:4因素线性模型 采用多元线性回归法建立了氢氰酸与4项指标的预测模型,模型及模型参数如下:

Y=238.8-0.6309X2-0.001564X3-0.08902X4-0.01227X5

如表6-55所示,模型4各系数P均小于0.05,说明模型4的各系数能够通过检验。如表6-56所示,模型4的P<0.05,决定系数R2为0.9110,说明模型4能够通过检验,有统计学意义。

表6-55 HCN模型4回归系数P检验

表6-56 HCN模型4性能指标

如图6-51所示,根据模型4计算的拟合值与实际测定值的线性相关线斜率为0.9882,R2为0.9034,说明模型4拟合值与实测值吻合度较好。由拟合误差图6-52可知,拟合值与观测值之间的误差大多分布在± 20μg/支这个范围内,且没有任何趋势,说明建立的模型是好的。

(5)模型5:4因素二次多项式模型 采用逐步回归法建立了氢氰酸与4项指标及其交叉项和二次项的预测模型,模型及模型参数如下:

Y=207.4-0.2291X4+0.0000001563X3X3+0.00004531X4X4+0.0008455X2X4-0.0002334X2X5-0.000003098X3X4-0.0000006812X3X5+0.00001750X4X5

如表6-57所示,模型5各系数P均小于0.05,说明模型5的各系数能够通过检验。由表6-58可知,模型5的P<0.05,决定系数R2为0.9545,说明模型5能够通过检验,有统计学意义。

图6-51 HCN模型4内部验证图

图6-52 HCN模型4内部验证残差图

表6-57 HCN模型5回归系数P检验

表6-58 HCN模型5性能指标

由图6-53可知,根据模型5计算的拟合值与实际测定值的线性相关线斜率为0.994,R2为0.9526,说明模型5拟合值与实测值吻合度较好。由拟合误差图6-54可知,拟合值与观测值之间的误差大多分布在± 20μg/支这个范围内,且没有任何趋势,说明建立的模型是好的。

(6) HCN预测模型优选 通过P检验的氢氰酸预测模型共计5个,各预测模型参数见表6-59。从表中看出,5个模型的R2均在0.9以上,说明5个模型回归效果很好,其中模型5的R2最大,交叉验证标准差RMSECV值最小,因此选择模型5作为氢氰酸最优预测模型。

图6-53 HCN模型5内部验证图

图6-54 HCN模型5内部验证残差图

表6-59 氢氰酸预测模型

7. 巴豆醛预测模型

巴豆醛的烤烟型预测模型建立采用了单因素和多因素设计的88个样品,释放量范围:6.7~25.5μg/支,建立预测模型过程如下:

(1)模型1:5因素线性模型 采用多元线性回归法建立了巴豆醛与5项指标的预测模型,模型及模型参数如下:

Y=14.99+0.1451X1-0.008288X2-1.104E-5X3-0.008397X4-0.0001592X5

从表6-60看出,模型1中X1X2X3X5的系数P分别为0.0939、0.5612、 0.8091和0.7051,说明本模型中X1X2X3X5的系数的可靠性稍差,但由表6-61可知,模型1的P<0.05,决定系数R2为0.7654,尽管模型1的决定系数较低,但是P<0.05,说明模型1具有一定的统计学意义。

表6-60 巴豆醛模型1回归系数P检验

表6-61 巴豆醛模型1性能指标

由图6-55可知,根据模型1计算的拟合值与实际测定值的线性相关线斜率为0.9863,R2为0.6978。由拟合误差图6-56可知,拟合值与观测值之间的误差大多分布在±4μg/支这个范围内,且没有任何趋势,说明模型1具备一定的预测能力,但预测效果一般。

图6-55 巴豆醛模型1内部验证图

图6-56 巴豆醛模型1内部验证残差图

(2)模型2:5因素二次多项式模型 采用逐步回归法建立了巴豆醛与5项指标及其交叉项和二次项的预测模型,模型及模型参数如下:

Y=16.40-0.004260X4+0.002546X1X1+0.000002181X4X4+0.000007556X1X3-0.00003946X2X4-0.0000006614X3X4

从表6-62看出,模型2中X4X4这项的系数P为0.1391,说明本模型中X4X4系数的可靠性稍差,但由表6-63可知,模型2的P<0.05,决定系数R2为0.8627,说明模型2能够通过检验,有统计学意义。

表6-62 巴豆醛模型2回归系数P检验

表6-63 巴豆醛模型2性能指标

如图6-57所示,根据模型2计算的拟合值与实际测定值的线性相关线斜率为0.992,R2为0.8422,说明模型2拟合值与实测值吻合度较好。由拟合误差图6-58可知,拟合值与观测值之间的误差大多分布在± 2μg/支这个范围内,且没有任何趋势,说明建立的模型是好的。

图6-57 巴豆醛模型2内部验证图

图6-58 巴豆醛模型2内部验证残差图

(3)模型3:5因素多因子及互作项模型 采用逐步回归法建立了巴豆醛与5项指标及其交叉项的预测模型,模型及模型参数如下:

Y=14.11+0.1504X1-0.002163X4+0.000006930X1X3-0.00003881X2X4-0.0000006338X3X4

如表6-64所示,模型3中X4的系数P为0.0802,说明本模型中X4系数的可靠性稍差,但由表6-65可知,模型3的P<0.05,决定系数R2为0.8589,说明模型3能够通过检验,有统计学意义。

表6-64 巴豆醛模型3回归系数P检验

表6-65 巴豆醛模型3性能指标

如图6-59所示,根据模型3计算的拟合值与实际测定值的线性相关线斜率为0.9917,R2为0.837,说明模型3拟合值与实测值吻合度较好。由拟合误差图6-60可知,拟合值与观测值之间的误差大多分布在± 3μg/支这个范围内,且没有任何趋势,说明建立的模型是好的。

图6-59 巴豆醛模型3内部验证图

图6-60 巴豆醛模型3内部验证残差图

单因素试验结论表明,巴豆醛释放量与卷烟纸克重、卷烟纸透气度和滤棒吸阻基本无关,因此对其余两个因素建立预测模型。

(4)模型4:2因素线性模型 采用多元线性回归法建立了巴豆醛与2项指标的预测模型,模型及模型参数如下:

Y=19.60-0.000005552X3-0.008366X4

从表6-66看出,模型4中X3的系数P为0.9032,说明本模型中X3系数的可靠性稍差,但由表6-67可知,模型4的P<0.05,决定系数R2为0.7548,尽管模型4的决定系数较低,但是P<0.05,说明模型4具有一定的统计学意义。

表6-66 巴豆醛模型4回归系数P检验

表6-67 巴豆醛模型4性能指标

由图6-61可知,根据模型4计算的拟合值与实际测定值的线性相关线斜率为0.9856,R2为0.6799。由拟合误差图6-62可知,拟合值与观测值之间的误差大多分布在±4μg/支这个范围内,说明模型4具备一定的预测能力,但预测效果一般。

图6-61 巴豆醛模型4内部验证图

图6-62 巴豆醛模型4内部验证残差图

(5)模型5:2因素二次多项式模型 采用逐步回归法建立了巴豆醛与2项指标及其交叉项和二次项的预测模型,模型及模型参数如下:

Y=18.56+0.0001949X3-0.004319X4-0.0000005985X3X4

如表6-68所示,模型5各系数P均小于0.05,说明模型5的各系数能够通过检验,由表6-69可知,模型5的P<0.05,决定系数R2为0.7654。尽管模型5的决定系数较低,但是P<0.05,说明模型5具有一定的统计学意义。

表6-68 巴豆醛模型5回归系数P检验

表6-69 巴豆醛模型5性能指标

如图6-63所示,根据模型5计算的拟合值与实际测定值的线性相关线斜率为0.9905,R2为0.808,说明模型5拟合值与实测值吻合度较好。由拟合误差图6-64可知,拟合值与观测值之间的误差大多分布在± 4μg/支这个范围内,且没有任何趋势,说明建立的模型是好的。

图6-63 巴豆醛模型5内部验证图

图6-64 巴豆醛模型5内部验证残差图

(6)巴豆醛预测模型优选 通过P检验的巴豆醛预测模型共计5个,各预测模型参数见表6-70。从表中看出,模型1、2和3的R2均在0.8以上,说明上述3个模型回归效果较好,其中模型2的 R2最大,交叉验证标准差RMSECV值最小,因此选择模型2作为巴豆醛最优预测模型。

表6-70 巴豆醛预测模型

8. 苯酚预测模型

苯酚的烤烟型预测模型建立采用了单因素和多因素设计的88个样品,释放量范围:5.7~17.2 μg/支,建立预测模型过程如下:

(1)模型1:5因素线性模型 采用多元线性回归法建立了苯酚与5项指标的预测模型,模型及模型参数如下:

Y=31.26-0.1584X1-0.03553X2-8.320E-5X3-0.004651X4-0.002446X5

如表6-71所示,模型1各系数P均小于0.05,说明模型1的各系数能够通过检验。如表6-72所示,模型1的P<0.05,决定系数R2为0.8553,说明模型1能够通过检验,有统计学意义。

表6-71 苯酚模型1回归系数P检验

表6-72 苯酚模型1性能指标

如图6-65所示,根据模型1计算的拟合值与实际测定值的线性相关线斜率为0.9937,R2为0.8319,说明模型1拟合值与实测值吻合度较好。由拟合误差图6-66可知,拟合值与观测值之间的误差大多分布在± 2μg/支这个范围内,且没有任何趋势,说明建立的模型是好的。

图6-65 苯酚模型1内部验证图

图6-66 苯酚模型1内部验证残差图

(2)模型2:5因素二次多项式模型 采用逐步回归法建立了苯酚与5项指标及其交叉项和二次项的预测模型,模型及模型参数如下:

Y=53.71-0.9237X1-0.01037X4-0.007591X5+0.0001989X1X4+0.0001676X1X5-0.00002863X2X4-0.000006178X2X5-0.0000002760X3X4+0.0000007638X4X5

如表6-73所示,模型2中X4X5的系数P为0.1435,说明本模型中X4X5系数的可靠性稍差,但如表6-74所示,模型2的P<0.05,决定系数R2为0.9093,说明模型2能够通过检验,有统计学意义。

如图6-67所示,根据模型2计算的拟合值与实际测定值的线性相关线斜率为0.996,R2为0.9006,说明模型2拟合值与实测值吻合度较好。由拟合误差图6-68可知,拟合值与观测值之间的误差大多分布在± 2μg/支这个范围内,且没有任何趋势,说明建立的模型是好的。

表6-73 苯酚模型2回归系数P检验

表6-74 苯酚模型2性能指标

图6-67 苯酚模型2内部验证图

图6-68 苯酚模型2内部验证残差图

(3)模型3:5因素多因子及互作项模型 采用逐步回归法建立了苯酚与5项指标及其交叉项的预测模型,模型及模型参数如下:

Y=53.71-0.9237X1-0.01037X4-0.007591X5+0.0001989X1X4+0.0001676X1X5-0.00002863X2X4-0.000006178X2X5-0.0000002760X3X4+0.0000007638X4X5

如表6-75所示,模型3中X4X5的系数P值为0.1435,说明本模型中X4X5系数的可靠性稍差,但由表6-76可知,模型3的P<0.05,决定系数R2为0.9093,说明模型3能够通过检验,有统计学意义。

表6-75 苯酚模型3回归系数P检验

表6-76 苯酚模型3性能指标

如图6-69所示,根据模型3计算的拟合值与实际测定值的线性相关线斜率为0.996,R2为0.9006,说明模型3拟合值与实测值吻合度较好。由拟合误差图6-70可知,拟合值与观测值之间的误差大多分布在± 2μg/支这个范围内,且没有任何趋势,说明建立的模型是好的。

图6-69 苯酚模型3内部验证图

图6-70 苯酚模型3内部验证残差图

可以看出,模型2和模型3是一致的,这是由于在做二次多项式回归计算过程中各因素的平方项影响较小而被剔除,因此导致模型2和模型3一致。

(4)苯酚预测模型优选 通过P检验的苯酚预测模型共计3个,各预测模型参数见表6-77。从表中看出,模型2的 R2最大,交叉验证标准差RMSECV值最小,因此选择模型2(模型2和模型3一致)作为苯酚最优预测模型。

表6-77 苯酚预测模型

9. 苯并 [a] 芘预测模型

苯并 [a] 芘的烤烟型预测模型建立采用了单因素和多因素设计的88个样品,释放量范围:6.5~17.5 ng/支,建立预测模型过程如下:

(1)模型1:5因素线性模型 采用多元线性回归法建立了苯并 [a] 芘与5项指标的预测模型,模型及模型参数如下:

Y=22.58-0.04937X1-0.05075X2-1.002E-4X3-0.003791X4-0.001170X5

从表6-78看出,模型1中X1系数b1P值为0.0621,说明本模型中X1系数的可靠性稍差,但由表6-79可知,模型1的P<0.05,决定系数R2为0.9158,说明模型1能够通过检验,有统计学意义。

表6-78 苯并 [a] 芘模型1回归系数P检验

表6-79 苯并 [a] 芘模型1性能指标

如图6-71所示,根据模型1计算的拟合值与实际测定值的线性相关线斜率为0.9937,R2为0.8319,说明模型1拟合值与实测值吻合度较好。由拟合误差图6-72可知,拟合值与观测值之间的误差大多分布在± 1.5ng/支这个范围内,且没有任何趋势,说明建立的模型是好的。

图6-71 苯并 [a] 芘模型1内部验证图

图6-72 苯并 [a] 芘模型1内部验证残差图

(2)模型2:5因素二次多项式模型 采用逐步回归法建立了苯并 [a]芘与5项指标及其交叉项和二次项的预测模型,模型及模型参数如下:

Y=30.06-1.089X1-0.1553X2-0.006636X4+0.003897X5+0.01292X1X1+0.001032X2X2+0.000000006589X3X3+0.0000008454X4X4-0.0000007870X5X5+0.00005650X1X5+0.00001635X2X4-0.0000001607X3X4-0.00000003647X3X5+0.0000005614X4X5

如表6-80所示,模型2中X5X1X1X1X5的系数P大于0.05,说明本模型中X5X1X1X1X5系数的可靠性稍差,但由表6-81可知,模型2的P<0.05,决定系数R2为0.9670,说明模型2能够通过检验,有统计学意义。

如图6-73所示,根据模型2计算的拟合值与实际测定值的线性相关线斜率为0.999,R2为0.9659,说明模型2拟合值与实测值吻合度较好。由拟合误差图6-74可知,拟合值与观测值之间的误差大多分布在±1ng/支这个范围内,且没有任何趋势,说明建立的模型是好的。

表6-80 苯并 [a] 芘模型2回归系数P检验

表6-81 苯并 [a] 芘模型2性能指标

图6-73 苯并 [a] 芘模型2内部验证图

图6-74 苯并 [a] 芘模型2内部验证残差图

(3)模型3:5因素多因子及互作项模型 采用逐步回归法建立了苯并[a] 芘与5项指标及其交叉项的预测模型,模型及模型参数如下:

Y=22.71-0.04777X1-0.05064X2-0.004843X4-0.001267X5-0.0000001286X3X4-0.00000001372X3X5+0.0000004664X4X5

如表6-82所示,模型3中X1X4X5的系数P>0.05,说明本模型中X1X4X5系数的可靠性稍差,但由表6-83可知,模型3的P<0.05,决定系数R2为0.9300,说明模型3能够通过检验,有统计学意义。

表6-82 苯并 [a] 芘模型3回归系数P检验

表6-83 苯并 [a] 芘模型3性能指标

如图6-75所示,根据模型3计算的拟合值与实际测定值的线性相关线斜率为0.9978,R2为0.9249,说明模型3拟合值与实测值吻合度较好。由拟合误差图6-76可知,拟合值与观测值之间的误差大多分布在± 1ng/支这个范围内,且没有任何趋势,说明建立的模型是好的。

图6-75 苯并 [a] 芘模型3内部验证图

图6-76 苯并 [a] 芘模型3内部验证残差图

(4)苯并 [a] 芘预测模型优选 通过P检验的苯并 [a] 芘预测模型共计3个,各预测模型参数见表6-84。从表中看出,3个模型的R2均在0.9以上,说明3个模型回归效果很好,其中模型2的R2最大,交叉验证标准差RMSECV值最小,因此选择模型2作为苯并 [a] 芘最优预测模型。

表6-84 苯并 [a] 芘预测模型

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈