卷烟材料影响有害成分预测模型的建立

更新时间：2025-10-14 理论教育 版权反馈

【摘要】：近年来的研究表明：卷烟材料对烟气特征的影响有其内在的规律性。表6-1 多因素样品设计表续表续表三、模型的建立与优化采用线性回归法和逐步回归法，分别建立了烟用材料设计参数对主流烟气中7种有害成分、烟碱、焦油释放量的多因素预测模型。

卷烟材料的合理组合即“三纸一棒”（成型纸、接装纸、卷烟纸和滤棒）是当前烟草企业最易实现的有效降焦减害方法之一。近年来的研究表明：卷烟材料对烟气特征的影响有其内在的规律性。“卷烟减害技术”重大专项提出最具代表性的7种卷烟烟气有害成分，即CO、HCN、NNK、NH₃、苯并 [a]芘、苯酚和巴豆醛，并以卷烟烟气危害性指数H来表征卷烟主流烟气的危害性，为行业减害降焦技术研究的深入开展提供了参考依据。为了实现在卷烟辅材设计的关键环节中对卷烟主流烟气中的有害成分、烟碱、焦油释放量化学成分释放量进行预测，辅助控制这些指标在标准规定的范围内，同时确保卷烟产品的质量，根据近年来卷烟烟用材料设计实验测定的主流烟气中有害成分、烟碱、焦油释放量成分释放量的检测数据，采用线性回归法和逐步回归法分别建立卷烟烟用材料参数对主流烟气中有害成分、烟碱、焦油释放量化学成分释放量的多因素预测模型，估计出了模型的系数，并根据交叉验证和外部验证的结果对模型进行优化，不断提高预测的精度，为低焦油、低危害产品的开发提供了数字模拟技术。

一、烟用材料设计参数及预测指标

共计5个烟用材料设计参数，分别为卷烟纸定量（X₁）、卷烟纸透气度（X₂）、成形纸透气度（X₃）、接装纸透气度（X₄）和滤棒压降（X₅）。预测指标共计9个：CO、HCN、NNK、NH₃、苯并 [a] 芘、苯酚、巴豆醛、烟碱和焦油。

二、卷烟样品设计

选取卷烟纸透气度、卷烟纸定量、接装纸透气度、成形纸透气度、滤棒压降5个因素，每个因素5个水平，采用中心组合结合正交设计制备了烤烟型和混合型卷烟各50个样品（表6-1）。

表6-1 多因素样品设计表

续表

三、模型的建立与优化

采用线性回归法和逐步回归法，分别建立了烟用材料设计参数对主流烟气中7种有害成分、烟碱、焦油释放量的多因素预测模型。预测模型建立采用了多因素设计的50个样品，并对所建模型进行95%置信水平的P检验，并依据交叉验证标准差RMSECV筛选出最优预测模型。

1. 烟碱预测模型

烟碱的烤烟型预测模型建立采用了多因素设计的50个样品，释放量范围：0.4～1.1mg/支，建立预测模型过程如下：

（1）模型1：5因素线性模型采用多元线性回归法建立了烟碱与5项指标的预测模型，模型及模型参数如下：

Y=1.506-0.0009423X₁-0.002199X₂-7.100E-6X₃-0.0003532X₄-8.845E-5X₅

如表6-2所示，模型1中X₁的系数P为0.6326，说明本模型中X₁系数的可靠性稍差，但由表6-3可知，模型1的P小于0.05，决定系数 R²为0.9308，说明模型1能够通过检验，有统计学意义。

表6-2 烟碱模型1回归系数P检验

表6-3 烟碱模型1性能指标

如图6-3所示，根据模型1计算的拟合值与实际测定值的线性相关线斜率为0.997，R²为0.9259，说明模型1拟合值与实测值吻合度较好。由拟合误差图6-4可知，拟合值与观测值之间的误差大多分布在± 0.15mg/支这个范围内，且没有任何趋势，说明建立的模型是好的。

图6-3 烟碱模型1内部验证图

图6-4 烟碱模型1内部验证残差图

（2）模型2：5因素二次多项式模型采用逐步回归法建立了烟碱与5项指标及其交叉项和二次项的预测模型，模型及模型参数如下：

Y=0.5234-0.005857X₂-0.0006599X₄+0.0004133X₅+0.00004175X₂X₂+0.0000001191X₄X₄-0.00000006192X₅X₅-0.00000003756X₂X₃-0.00000001420X₃X₄+0.00000006745X₄X₅

如表6-4所示，模型2各系数P均小于0.05，说明模型2的各系数能够通过检验。由表6-5可知，模型2的P＜0.05，决定系数R²为0.9660，说明模型2能够通过检验，有统计学意义。

表6-4 烟碱模型2回归系数P检验

表6-5 烟碱模型2性能指标

如图6-5所示，根据模型2计算的拟合值与实际测定值的线性相关线斜率为0.9971，R²为0.9134，说明模型2拟合值与实测值吻合度较好。由拟合误差图6-6可知，拟合值与观测值之间的误差大多分布在± 0.15mg/支这个范围内，且没有任何趋势，说明建立的模型是好的。

图6-5 烟碱模型2内部验证图

图6-6 烟碱模型2内部验证残差图

（3）模型3：5因素多因子及互作项模型采用逐步回归法建立了烟碱与5项指标及其交叉项的预测模型，模型及模型参数如下：

Y=1.008+0.00006660X₁X₂-0.000006254X₁X₄-0.0000009709X₂X₄-0.0000008768X₂X₅-0.00000001276X₃X₄

从表6-6看出，模型3中 X₂X₄的系数P值为0.1806，说明本模型中X₂X₄系数的可靠性稍差，但由表6-7可知，模型3的P值小于0.05，决定系数R²为0.9182，说明模型3能够通过检验，有统计学意义。

表6-6 烟碱模型3回归系数P检验

表6-7 烟碱模型3性能指标

由图6-7可知，根据模型3计算的拟合值与实际测定值的线性相关线斜率为0.997，R²为0.9111，说明模型3拟合值与实测值吻合度较好。由拟合误差图6-8可知，拟合值与观测值之间的误差大多分布在± 0.15mg/支这个范围内，且没有任何趋势，说明建立的模型是好的。

图6-7 烟碱模型3内部验证图

图6-8 烟碱模型3内部验证残差图

单因素试验结果表明，烟碱释放量与卷烟纸定量之间基本无关，因此对其余四因素建立预测模型。

（4）模型4：4因素线性模型采用多元线性回归法建立了烟碱与4项指标的预测模型，模型及模型参数如下：

Y=1.279-0.002181X₂-0.000004320X₃-0.0003177X₄-0.00005397X₅

如表6-8所示，模型4各系数P值均小于0.05，说明模型4的各系数能够通过检验。如表6-9所示，模型4的P＜0.05，决定系数R²为0.8885，说明模型4能够通过检验，有统计学意义。

表6-8 烟碱模型4回归系数P检验

表6-9 烟碱模型4性能指标

如图6-9所示，根据模型4计算的拟合值与实际测定值的线性相关线斜率为0.996，R²为0.875，说明模型4拟合值与实测值吻合度较好。由拟合误差图6-10可知，拟合值与观测值之间的误差大多分布在± 0.15mg/支这个范围内，且没有任何趋势，说明建立的模型是好的。

图6-9 烟碱模型4内部验证图

图6-10 烟碱模型4内部验证残差图

（5）模型5：4因素二次多项式模型采用逐步回归法建立了烟碱与4项指标及其交叉项和二次项的预测模型，模型及模型参数如下：

Y=1.208-0.0003734X₄-0.00004730X₅+0.00000005514X₄X₄-0.000001085X₂X₄-0.0000004085X₂X₅-0.00000001362X₃X₄+0.00000003552X₄X₅

从表6-10看出，模型5中X₄X₄、 X₂X₄和X₄X₅的系数P＞0.05，说明本模型中X₄X₄、 X₂X₄和X₄X₅系数的可靠性稍差，但由表6-11可知，模型5的P＜0.05，决定系数R²为0.9225，说明模型5能够通过检验，有统计学意义。

表6-10 烟碱模型5回归系数P检验

表6-11 烟碱模型5性能指标

由图6-11可知，根据模型5计算的拟合值与实际测定值的线性相关线斜率为0.9966，R²为0.9141，说明模型5拟合值与实测值吻合度较好。由拟合误差图6-12可知，拟合值与观测值之间的误差大多分布在± 0.1mg/支这个范围内，且没有任何趋势，说明建立的模型是好的。

图6-11 烟碱模型5内部验证图

图6-12 烟碱模型5内部验证残差图

（6）烟碱预测模型优选通过P检验的烟碱预测模型共计5个，各预测模型参数见表6-12。从表中看出，5个模型的R²均在0.9以上，其中模型2的R²最大，交叉验证标准差RMSECV值最小，因此选择模型2作为烟碱最优预测模型。

表6-12 烟碱预测模型

2. 焦油预测模型

焦油的烤烟型预测模型建立采用了单因素和多因素设计的88个样品，释放量范围：4.3～15.3mg/支，建立预测模型过程如下：

（1）模型1：5因素线性模型采用多元线性回归法建立了焦油与5项指标的预测模型，模型及模型参数如下：

Y=20.35+0.001426X₁-0.03542X₂-0.0001272X₃-0.005745X₄-0.001246X₅

如表6-13所示，模型1中X₁的系数P=0.9625，说明本模型中X₁系数的可靠性稍差，但由表6-14可知，模型1的P值＜0.05，决定系数 R²为0.9517，说明模型1能够通过检验，有统计学意义。

表6-13 焦油模型1回归系数P检验

表6-14 焦油模型1性能指标

由图6-13可知，根据模型1计算的拟合值与实际测定值的线性相关线斜率为0.9967，R²为0.9494，说明模型1拟合值与实测值吻合度较好。由拟合误差6-14图可知，拟合值与观测值之间的误差大多分布在± 1.5mg/支这个范围内，且没有任何趋势，说明建立的模型是好的。

图6-13 焦油模型1内部验证图

图6-14 焦油模型1内部验证残差图

（2）模型2：5因素二次多项式模型采用逐步回归法建立了焦油与5项指标及其交叉项和二次项的预测模型，模型及模型参数如下：

Y=22.39-0.08190X₂-0.01201X₄-0.001451X₅+0.0004575X₂X₂+0.00000001125X₃X₃+0.000002633X₄X₄-0.000005439X₁X₃-0.000001393X₂X₃+0.00002932X₂X₄-0.0000001907X₃X₄+0.0000008406X₄X₅

如表6-15所示，模型2各系数P值均小于0.05，说明模型2的各系数能够通过检验。如表6-16所示，模型2的P＜0.05，决定系数R²为0.9836，说明模型2能够通过检验，有统计学意义。

表6-15 焦油模型2回归系数P检验

表6-16 焦油模型2性能指标

如图6-15所示，根据模型2计算的拟合值与实际测定值的线性相关线斜率为0.9989，R²为0.9833，说明模型2拟合值与实测值吻合度较好。由拟合误差6-16图可知，拟合值与观测值之间的误差大多分布在± 1mg/支这个范围内，且没有任何趋势，说明建立的模型是好的。

图6-15 焦油模型2内部验证图

图6-16 焦油模型2内部验证残差图

（3）模型3：5因素多因子及互作项模型采用逐步回归法建立了焦油与5项指标及其交叉项的预测模型，模型及模型参数如下：

Y=19.28-0.00009315X₃-0.0084X₄-0.0009619X₅+0.00001839X₂X₄-0.00001010X₂X₅-0.0000001012X₃X₄+0.0000005786X₄X₅

从表6-17看出，模型3中X₂X₄和X₄X₅的系数P为＞0.05，说明本模型中X₂X₄和X₄X₅系数的可靠性稍差，但由表6-18可知，模型3的P＜0.05，决定系数R²为0.9601，说明模型3能够通过检验，有统计学意义。

表6-17 焦油模型3回归系数P检验

表6-18 焦油模型3性能指标

由图6-17可知，根据模型3计算的拟合值与实际测定值的线性相关线斜率为0.9972，R²为0.9585，说明模型3拟合值与实测值吻合度较好。由拟合误差图6-18可知，拟合值与观测值之间的误差大多分布在± 1.5mg/支这个范围内，且没有任何趋势，说明建立的模型是好的。

图6-17 焦油模型3内部验证图

图6-18 焦油模型3内部验证残差图

单因素试验结论表明，焦油释放量与卷烟纸克重基本无关，因此对其余4个因素建立预测模型。

（4）模型4：4因素线性模型采用多元线性回归法建立了焦油与4项指标的预测模型，模型及模型参数如下：

Y=20.31-0.03540X₂-0.0001272X₃-0.005745X₄-0.001247X₅

如表6-19所示，模型4各系数P均小于0.05，说明模型4的各系数能够通过检验。如表6-20所示，模型4的P＜0.05，决定系数R²为0.9517，说明模型4能够通过检验，有统计学意义。

表6-19 焦油模型4回归系数P检验

表6-20 焦油模型4性能指标

由图6-19可知，根据模型4计算的拟合值与实际测定值的线性相关线斜率为0.9967，R²为0.9494，说明模型4拟合值与实测值吻合度较好。由拟合误差图可知，拟合值与观测值之间的误差大多分布在± 1.5mg/支这个范围内，且没有任何趋势，说明建立的模型是好的。

图6-19 焦油模型4内部验证图

图6-20 焦油模型4内部验证残差图

（5）模型5：4因素二次多项式模型采用逐步回归法建立了焦油与4项指标及其交叉项和二次项的预测模型，模型及模型参数如下：

Y=22.26-0.07651X₂-0.0001846X₃-0.01117X₄-0.001445X₅+0.0003995X₂X₂+0.00000001149X₃X₃+0.000002648X₄X₄-0.0000009509X₂X₃+0.00002327X₂X₄-0.0000001964X₃X₄+0.0000007153X₄X₅

如表6-21所示，模型5中X₂X₃的系数P=0.1195，说明本模型中X₂X₃系数的可靠性稍差，但如表6-22所示，模型5的P＜0.05，决定系数R²为0.9826，说明模型5能够通过检验，有统计学意义。

表6-21 焦油模型5回归系数P检验

表6-22 焦油模型5性能指标

如图6-21所示，根据模型5计算的拟合值与实际测定值的线性相关线斜率为0.9988，R²为0.9823，说明模型5拟合值与实测值吻合度较好。由拟合误差图6-22可知，拟合值与观测值之间的误差大多分布在± 1.5mg/支这个范围内，且没有任何趋势，说明建立的模型是好的。

（6）焦油预测模型优选通过P检验的焦油预测模型共计5个，各预测模型参数见表6-23。从表中看出，5个模型的R²均在0.9以上，说明5个模型回归效果很好，其中模型2的R²最大，交叉验证标准差RMSECV值最小，因此选择模型2作为焦油最优预测模型。

图6-21 焦油模型5内部验证图

图6-22 焦油模型5内部验证残差图

表6-23 焦油预测模型

3. 一氧化碳预测模型

一氧化碳的烤烟型预测模型建立采用了单因素和多因素设计的88个样品，释放量范围：4.3～18.3mg/支，建立预测模型过程如下：

（1）模型1：5因素线性模型采用多元线性回归法建立了一氧化碳与5项指标的预测模型，模型及模型参数如下：

Y=16.75+0.1202X₁-0.05884X₂-0.0001602X₃-0.007204X₄-0.0005313X₅

如表6-24所示，模型1的各系数P均小于0.05，说明模型1的各系数能够通过检验。如表6-25所示，模型1的P＜0.05，决定系数R²为0.9388，说明模型1能够通过检验，有统计学意义。

表6-24 CO模型1回归系数P检验

表6-25 CO模型1性能指标

由图6-23可知，根据模型1计算的拟合值与实际测定值的线性相关线斜率为0.9945，R²为0.9352，说明模型1拟合值与实测值吻合度较好。由残差图6-24可知，拟合值与观测值之间的误差大多分布在± 1.5mg/支这个范围内，且没有任何趋势，说明建立的模型是好的。

图6-23 CO模型1内部验证图

图6-24 CO模型1内部验证残差图

（2）模型2：5因素二次多项式模型采用逐步回归法建立了一氧化碳与5项指标及其交叉项和二次项的预测模型，模型及模型参数如下：

Y=11.34+0.2503X₁-0.009874X₄+0.00000001083X₃X₃+0.000003930X₄X₄-0.000007910X₁X₃-0.0002216X₁X₄+0.00003626X₂X₄-0.00001644X₂X₅-0.0000002398X₃X₄+0.000001206X₄X₅

如表6-26所示，模型2各系数P均小于0.05，说明模型2的各系数能够通过检验，如表6-27所示，模型2的P＜0.05，决定系数R²为0.9752，说明模型2能够通过检验，有统计学意义。

表6-26 CO模型2各回归系数P检验

表6-27 CO模型2性能指标

如图6-25所示，根据模型2计算的拟合值与实际测定值的线性相关线斜率为0.9978，R²为0.9746，说明模型2拟合值与实测值吻合度较好。由拟合误差图6-26可知，拟合值与观测值之间的误差大多分布在± 1.0mg/支这个范围内，且没有任何趋势，说明建立的模型是好的。

图6-25 CO模型2内部验证图

图6-26 CO模型2内部验证残差图

（3）模型3：5因素多因子及互作项模型采用逐步回归法建立了一氧化碳与5项指标及其交叉项的预测模型，模型及模型参数如下：

Y=12.86+0.1660X₁-0.006211X₄-0.0002010X₁X₄-0.000001918X₂X₃+0.00004198X₂X₄-0.00001405X₂X₅-0.0000001584X₃X₄+0.0000009256X₄X₅

如表6-28所示，模型3各系数P均小于0.05，说明模型3的各系数能够通过检验，如表6-29所示，模型3的P＜0.05，决定系数R²为0.9534，说明模型3能够通过检验，有统计学意义。

表6-28 CO模型3各回归系数P检验

表6-29 CO模型3性能指标

如图6-27所示，根据模型3计算的拟合值与实际测定值的线性相关线斜率为0.9958，R²为0.9514，说明模型3拟合值与实测值吻合度较好。由拟合误差图6-28可知，拟合值与观测值之间的误差大多分布在± 1.5mg/支这个范围内，且没有任何趋势，说明建立的模型是好的。

图6-27 CO模型3内部验证图

图6-28 CO模型3内部验证残差图

（4） CO预测模型优选通过P检验的一氧化碳预测模型共计3个，各预测模型参数见表6-30。从表中看出，3个模型的R²均在0.9以上，说明3个模型回归效果很好，其中模型2的R²最大，交叉验证标准差RMSECV值最小，因此选择模型2作为一氧化碳最优预测模型。

表6-30 一氧化碳预测模型

4. NNK预测模型

NNK的烤烟型预测模型建立采用了单因素和多因素设计的88个样品，释放量范围：1.4～4.4ng/支，建立预测模型过程如下：

（1）模型1：5因素线性模型采用多元线性回归法建立了NNK与5项指标的预测模型，模型及模型参数如下：

Y=8.617-0.08538X₁-0.0006251X₂-6.159E-5X₃-0.0007446X₄-0.0005918X₅

如表6-31所示，模型1各系数P均小于0.05，说明模型1的各系数能够通过检验，如表6-32所示，模型1的P＜0.05，决定系数R²为0.4984。尽管模型1的决定系数较低，但是P＜0.05，说明模型1具有一定的统计学意义。

表6-31 NNK模型1回归系数P检验

表6-32 NNK模型1性能指标

如图6-29所示，根据模型1计算的拟合值与实际测定值的线性相关线斜率为0.4984，R²为0.4984，由残差图6-30可知，拟合值与观测值之间的误差大多分布在±1.5ng/支这个范围内，说明模型1具备一定的预测能力，但预测效果一般。

图6-29 NNK模型1内部验证图

图6-30 NNK模型1内部验证残差图

（2）模型2：5因素二次多项式模型采用逐步回归法建立了NNK与5项指标及其交叉项和二次项的预测模型，模型及模型参数如下：

Y=5.977-0.0001942X₃+0.000000008991X₃X₃-0.00002029X₁X₄-0.00001712X₁X₅

如表6-33所示，模型2各系数P均小于0.05，说明模型2的各系数能够通过检验，由表6-34可知，模型2的P＜0.05，决定系数R²为0.4725。尽管模型2的决定系数较低，但是P＜0.05，说明模型2具有一定的统计学意义。

表6-33 NNK模型2回归系数P检验

表6-34 NNK模型2性能指标

如图6-31所示，根据模型2计算的拟合值与实际测定值的线性相关线斜率为0.4725，R²为0.4725，由残差图6-32可知，拟合值与观测值之间的误差大多分布在±1.5ng/支这个范围内，说明模型2具备一定的预测能力，但预测效果一般。

图6-31 NNK模型2内部验证图

图6-32 NNK模型2内部验证残差图

（3）模型3：5因素多因子及互作项模型采用逐步回归法建立了NNK与5项指标及其交叉项的预测模型，模型及模型参数如下：

Y=5.809-0.00005117X₃-0.00002535X₁X₄-0.00001794X₁X₅

如表6-35所示，模型3各系数P均小于0.05，说明模型3的各系数能够通过检验，如表6-36所示，模型3的P＜0.05，决定系数R²为0.4294。尽管模型3的决定系数较低，但是P＜0.05，说明模型3具有一定的统计学意义。

表6-35 NNK模型3回归系数P检验

表6-36 NNK模型3性能指标

由图6-33可知，根据模型3计算的拟合值与实际测定值的线性相关线斜率为0.4294，R²为0.4294，由残差图6-34可知，拟合值与观测值之间的误差大多分布在±1.5ng/支这个范围内，说明模型3具备一定的预测能力，但预测效果一般。

图6-33 NNK模型3内部验证图

图6-34 NNK模型3内部验证残差图

根据单因素试验结论，NNK释放量与卷烟纸克重无关，因此对其余四个因素分别建立了线性模型和二次多项式模型。

（4）模型4：4因素线性模型采用多元线性回归法建立了NNK与4项指标的预测模型，模型及模型参数如下：

Y=6.326+0.000393X₂-0.00005247X₃-0.0007721X₄-0.0006544X₅

如表6-37所示，模型4中X₂的系数P为0.9379，说明本模型中X₂系数的可靠性稍差，如表6-38所示，模型4的P＜0.05，决定系数R²为0.3782，尽管模型4的决定系数较低，但是P＜0.05，说明模型4具有一定的统计学意义。

如图6-35所示，根据模型4计算的拟合值与实际测定值的线性相关线斜率为0.3782，R²为0.3781，由残差图6-36可知，拟合值与观测值之间的误差大多分布在±1.5ng/支这个范围内，说明模型4具备一定的预测能力，但预测效果一般。

表6-37 NNK模型4回归系数P检验

表6-38 NNK模型4性能指标

图6-35 NNK模型4内部验证图

图6-36 NNK模型4内部验证残差图

（5）模型5：4因素二次多项式模型采用逐步回归法建立了NNK与4项指标及其交叉项和二次项的预测模型，模型及模型参数如下：

Y=-18.01-0.0001963X₃+0.01085X₅+0.000000008985X₃X₃-0.000001331X₅X₅-0.0000001305X₄X₅

如表6-39所示，模型5各系数P均小于0.05，说明模型5的各系数能够通过检验，如表6-40所示，模型5的P＜0.05，决定系数R²为0.4358。尽管模型5的决定系数较低，但是P＜0.05，说明模型5具有一定的统计学意义。

表6-39 NNK模型5回归系数P检验

表6-40 NNK模型5性能指标

如图6-37所示，根据模型5计算的拟合值与实际测定值的线性相关线斜率为0.4358，R²为0.4358，由残差图6-38可知，拟合值与观测值之间的误差大多分布在±1.5ng/支这个范围内，说明模型5具备一定的预测能力，但预测效果一般。

图6-37 NNK模型5内部验证图

图6-38 NNK模型5内部验证图

（6） NNK预测模型优选通过P检验的NNK预测模型共计5个，各预测模型参数见表6-41。从表中看出，5个模型的R²均较小，说明5个模型回归效果较差，这可能是由于烤烟型卷烟NNK释放量较小，测试误差相对较大的原因。其中模型1的R²最大，RMSECV值最小，因此选择模型1作为NNK最优预测模型。

表6-41 NNK预测模型

5. 氨预测模型

NH₃的烤烟型预测模型建立采用了单因素和多因素设计的88个样品，释放量范围：2.7～9.7μg/支，建立预测模型过程如下：(https://www.daowen.com)

（1）模型1：5因素线性模型采用多元线性回归法建立了氨与5项指标的预测模型，模型及模型参数如下：

Y=14.21-0.04198X₁-0.01451X₂-7.309E-5X₃-0.002923X₄-0.0009585X₅

如表6-42所示，模型1中X₁的系数P为0.106，说明本模型中X₁系数的可靠性稍差，但如表6-43所示，模型1的P＜0.05，决定系数R²为0.8567，说明模型1能够通过检验，有统计学意义。

表6-42 NH₃模型1回归系数P检验

表6-43 NH₃模型1性能指标

如图6-39所示，根据模型1计算的拟合值与实际测定值的线性相关线斜率为0.9925，R²为0.8339，说明模型1拟合值与实测值吻合度较好。由拟合误差图6-40可知，拟合值与观测值之间的误差大多分布在± 1.5μg/支这个范围内，且不具有一定趋势，说明建立的模型是好的。

图6-39 NH₃模型1内部验证图

图6-40 NH₃模型1内部验证残差图

（2）模型2：5因素二次多项式模型采用逐步回归法建立了氨与5项指标及其交叉项和二次项的预测模型，模型及模型参数如下：

Y=11.43-0.005619X₄-0.0000001577X₅X₅-0.0004755X₁X₂-0.0000006914X₁X₃-0.0000001638X₃X₄+0.0000009289X₄X₅

如表6-44所示，模型2中X₁X₃的系数P为0.1629，说明本模型中X₁X₃系数的可靠性稍差，但由表6-45可知，模型2的P＜0.05，决定系数R²为0.9041，说明模型2能够通过检验，有统计学意义。

表6-44 NH₃模型2回归系数P检验

表6-45 NH₃模型2性能指标

如图6-41所示，根据模型2计算的拟合值与实际测定值的线性相关线斜率为0.995，R²为0.8945，说明模型2拟合值与实测值吻合度较好。由拟合误差图6-42可知，拟合值与观测值之间的误差大多分布在± 1μg/支这个范围内，且不具有一定趋势，说明建立的模型是好的。

图6-41 NH₃模型2内部验证图

图6-42 NH₃模型2内部验证残差图

（3）模型3：5因素多因子及互作项模型采用逐步回归法建立了氨与5项指标及其交叉项的预测模型，模型及模型参数如下：

Y=14.28-0.005609X₄-0.001346X₅-0.0004749X₁X₂-0.0000007123X₁X₃-0.0000001623X₃X₄+0.0000009224X₄X₅

如表6-46所示，模型3中X₁X₃的系数P为0.1529，说明本模型中X₁X₃系数的可靠性稍差，但如表6-47所示，模型3的P＜0.05，决定系数R²为0.9030，说明模型3能够通过检验，有统计学意义。

表6-46 NH₃模型3回归系数P检验

表6-47 NH₃模型3性能指标

如图6-43所示，根据模型3计算的拟合值与实际测定值的线性相关线斜率为0.9949，R²为0.8931，说明模型3拟合值与实测值吻合度较好。由拟合误差图6-44可知，拟合值与观测值之间的误差大多分布在± 1μg/支这个范围内，且不具有一定趋势，说明建立的模型是好的。

图6-43 NH₃模型3内部验证图

图6-44 NH₃模型3内部验证残差图

（4）氨预测模型优选通过P检验的氨预测模型共计3个，各预测模型参数见表6-48。从表中看出，从表中看出，模型2的R²最大，交叉验证标准差RMSECV值最小，因此选择模型2作为氨最优预测模型。

表6-48 NH₃预测模型

6. 氢氰酸预测模型

HCN的烤烟型预测模型建立采用了单因素和多因素设计的88个样品，释放量范围：29.4～193.6μg/支，建立预测模型过程如下：

（1）模型1：5因素线性模型采用多元线性回归法建立了氢氰酸与5项指标的预测模型，模型及模型参数如下：

Y=222.9+0.5910X₁-0.6239X₂-0.001570X₃-0.08922X₄-0.01270X₅

如表6-49所示，模型1中X₁的系数b₁的P为0.2919，说明本模型中X₁系数的可靠性稍差，但如表6-50所示，模型1的P＜0.05，决定系数R²为0.9122，说明模型1能够通过检验，有统计学意义。

表6-49 HCN模型1回归系数P检验

表6-50 HCN模型1性能指标

如图6-45所示，根据模型1计算的拟合值与实际测定值的线性相关线斜率为0.9884，R²为0.9048，说明模型1拟合值与实测值吻合度较好。由拟合误差图6-46可知，拟合值与观测值之间的误差大多分布在± 20μg/支这个范围内，且不具有一定趋势，说明建立的模型是好的。

图6-45 HCN模型1内部验证图

图6-46 HCN模型1内部验证图

（2）模型2：5因素二次多项式模型采用逐步回归法建立了氢氰酸与5项指标及其交叉项和二次项的预测模型，模型及模型参数如下：

Y=226.3-0.1881X₄-0.006251X₅+0.0007642X₂X₄-0.0002207X₂X₅-0.000001835X₃X₄-0.0000002256X₃X₅+0.00001747X₄X₅

如表6-49所示，模型2中X₅的系数P为0.1549，说明本模型中X₅系数的可靠性稍差，但如表6-52所示，模型2的P＜0.05，决定系数R²为0.9346，说明模型2能够通过检验，有统计学意义。

表6-51 HCN模型2回归系数P检验

表6-52 HCN模型2性能指标

如图6-47所示，根据模型2计算的拟合值与实际测定值的线性相关线斜率为0.9913，R²为0.9507，说明模型2拟合值与实测值吻合度较好。由拟合误差图6-48可知，拟合值与观测值之间的误差大多分布在± 20μg/支这个范围内，且没有任何趋势，说明建立的模型是好的。

图6-47 HCN模型2内部验证图

图6-48 HCN模型2内部验证残差图

（3）模型3：5因素多因子及互作项模型采用逐步回归法建立了氢氰酸与5项指标及其交叉项的预测模型，模型及模型参数如下：

Y=226.3-0.1881X₄-0.006251X₅+0.0007642X₂X₄-0.0002207X₂X₅-0.000001835X₃X₄-0.0000002256X₃X₅+0.00001747X₄X₅

如表6-53所示，模型3中X₅的系数P为0.1549，说明本模型中X₅系数的可靠性稍差，但如表6-54所示，模型3的P＜0.05，决定系数R²为0.9346，说明模型3能够通过检验，有统计学意义。

表6-53 HCN模型3回归系数P检验

表6-54 HCN模型3性能指标

如图6-49所示，根据模型3计算的拟合值与实际测定值的线性相关线斜率为0.9913，R²为0.9507，说明模型3拟合值与实测值吻合度较好。由拟合误差图6-50可知，拟合值与观测值之间的误差大多分布在± 20μg/支这个范围内，且没有任何趋势，说明建立的模型是好的。

图6-49 HCN模型3内部验证图

图6-50 HCN模型3内部验证残差图

可以看出，模型2和模型3是一致的，这是由于在做二次多项式回归计算过程中各因素的平方项影响较小而被剔除，因此导致模型2和模型3一致。

根据单因素试验结论，卷烟纸定量对HCN释放量基本无影响，因此对其余四个因素建立预测模型。

（4）模型4：4因素线性模型采用多元线性回归法建立了氢氰酸与4项指标的预测模型，模型及模型参数如下：

Y=238.8-0.6309X₂-0.001564X₃-0.08902X₄-0.01227X₅

如表6-55所示，模型4各系数P均小于0.05，说明模型4的各系数能够通过检验。如表6-56所示，模型4的P＜0.05，决定系数R²为0.9110，说明模型4能够通过检验，有统计学意义。

表6-55 HCN模型4回归系数P检验

表6-56 HCN模型4性能指标

如图6-51所示，根据模型4计算的拟合值与实际测定值的线性相关线斜率为0.9882，R²为0.9034，说明模型4拟合值与实测值吻合度较好。由拟合误差图6-52可知，拟合值与观测值之间的误差大多分布在± 20μg/支这个范围内，且没有任何趋势，说明建立的模型是好的。

（5）模型5：4因素二次多项式模型采用逐步回归法建立了氢氰酸与4项指标及其交叉项和二次项的预测模型，模型及模型参数如下：

Y=207.4-0.2291X₄+0.0000001563X₃X₃+0.00004531X₄X₄+0.0008455X₂X₄-0.0002334X₂X₅-0.000003098X₃X₄-0.0000006812X₃X₅+0.00001750X₄X₅

如表6-57所示，模型5各系数P均小于0.05，说明模型5的各系数能够通过检验。由表6-58可知，模型5的P＜0.05，决定系数R²为0.9545，说明模型5能够通过检验，有统计学意义。

图6-51 HCN模型4内部验证图

图6-52 HCN模型4内部验证残差图

表6-57 HCN模型5回归系数P检验

表6-58 HCN模型5性能指标

由图6-53可知，根据模型5计算的拟合值与实际测定值的线性相关线斜率为0.994，R²为0.9526，说明模型5拟合值与实测值吻合度较好。由拟合误差图6-54可知，拟合值与观测值之间的误差大多分布在± 20μg/支这个范围内，且没有任何趋势，说明建立的模型是好的。

（6） HCN预测模型优选通过P检验的氢氰酸预测模型共计5个，各预测模型参数见表6-59。从表中看出，5个模型的R²均在0.9以上，说明5个模型回归效果很好，其中模型5的R²最大，交叉验证标准差RMSECV值最小，因此选择模型5作为氢氰酸最优预测模型。

图6-53 HCN模型5内部验证图

图6-54 HCN模型5内部验证残差图

表6-59 氢氰酸预测模型

7. 巴豆醛预测模型

巴豆醛的烤烟型预测模型建立采用了单因素和多因素设计的88个样品，释放量范围：6.7～25.5μg/支，建立预测模型过程如下：

（1）模型1：5因素线性模型采用多元线性回归法建立了巴豆醛与5项指标的预测模型，模型及模型参数如下：

Y=14.99+0.1451X₁-0.008288X₂-1.104E-5X₃-0.008397X₄-0.0001592X₅

从表6-60看出，模型1中X₁、 X₂、 X₃和X₅的系数P分别为0.0939、0.5612、 0.8091和0.7051，说明本模型中X₁、 X₂、 X₃和X₅的系数的可靠性稍差，但由表6-61可知，模型1的P＜0.05，决定系数R²为0.7654，尽管模型1的决定系数较低，但是P＜0.05，说明模型1具有一定的统计学意义。

表6-60 巴豆醛模型1回归系数P检验

表6-61 巴豆醛模型1性能指标

由图6-55可知，根据模型1计算的拟合值与实际测定值的线性相关线斜率为0.9863，R²为0.6978。由拟合误差图6-56可知，拟合值与观测值之间的误差大多分布在±4μg/支这个范围内，且没有任何趋势，说明模型1具备一定的预测能力，但预测效果一般。

图6-55 巴豆醛模型1内部验证图

图6-56 巴豆醛模型1内部验证残差图

（2）模型2：5因素二次多项式模型采用逐步回归法建立了巴豆醛与5项指标及其交叉项和二次项的预测模型，模型及模型参数如下：

Y=16.40-0.004260X₄+0.002546X₁X₁+0.000002181X₄X₄+0.000007556X₁X₃-0.00003946X₂X₄-0.0000006614X₃X₄

从表6-62看出，模型2中X₄X₄这项的系数P为0.1391，说明本模型中X₄X₄系数的可靠性稍差，但由表6-63可知，模型2的P＜0.05，决定系数R²为0.8627，说明模型2能够通过检验，有统计学意义。

表6-62 巴豆醛模型2回归系数P检验

表6-63 巴豆醛模型2性能指标

如图6-57所示，根据模型2计算的拟合值与实际测定值的线性相关线斜率为0.992，R²为0.8422，说明模型2拟合值与实测值吻合度较好。由拟合误差图6-58可知，拟合值与观测值之间的误差大多分布在± 2μg/支这个范围内，且没有任何趋势，说明建立的模型是好的。

图6-57 巴豆醛模型2内部验证图

图6-58 巴豆醛模型2内部验证残差图

（3）模型3：5因素多因子及互作项模型采用逐步回归法建立了巴豆醛与5项指标及其交叉项的预测模型，模型及模型参数如下：

Y=14.11+0.1504X₁-0.002163X₄+0.000006930X₁X₃-0.00003881X₂X₄-0.0000006338X₃X₄

如表6-64所示，模型3中X₄的系数P为0.0802，说明本模型中X₄系数的可靠性稍差，但由表6-65可知，模型3的P＜0.05，决定系数R²为0.8589，说明模型3能够通过检验，有统计学意义。

表6-64 巴豆醛模型3回归系数P检验

表6-65 巴豆醛模型3性能指标

如图6-59所示，根据模型3计算的拟合值与实际测定值的线性相关线斜率为0.9917，R²为0.837，说明模型3拟合值与实测值吻合度较好。由拟合误差图6-60可知，拟合值与观测值之间的误差大多分布在± 3μg/支这个范围内，且没有任何趋势，说明建立的模型是好的。

图6-59 巴豆醛模型3内部验证图

图6-60 巴豆醛模型3内部验证残差图

单因素试验结论表明，巴豆醛释放量与卷烟纸克重、卷烟纸透气度和滤棒吸阻基本无关，因此对其余两个因素建立预测模型。

（4）模型4：2因素线性模型采用多元线性回归法建立了巴豆醛与2项指标的预测模型，模型及模型参数如下：

Y=19.60-0.000005552X₃-0.008366X₄

从表6-66看出，模型4中X₃的系数P为0.9032，说明本模型中X₃系数的可靠性稍差，但由表6-67可知，模型4的P＜0.05，决定系数R²为0.7548，尽管模型4的决定系数较低，但是P＜0.05，说明模型4具有一定的统计学意义。

表6-66 巴豆醛模型4回归系数P检验

表6-67 巴豆醛模型4性能指标

由图6-61可知，根据模型4计算的拟合值与实际测定值的线性相关线斜率为0.9856，R²为0.6799。由拟合误差图6-62可知，拟合值与观测值之间的误差大多分布在±4μg/支这个范围内，说明模型4具备一定的预测能力，但预测效果一般。

图6-61 巴豆醛模型4内部验证图

图6-62 巴豆醛模型4内部验证残差图

（5）模型5：2因素二次多项式模型采用逐步回归法建立了巴豆醛与2项指标及其交叉项和二次项的预测模型，模型及模型参数如下：

Y=18.56+0.0001949X₃-0.004319X₄-0.0000005985X₃X₄

如表6-68所示，模型5各系数P均小于0.05，说明模型5的各系数能够通过检验，由表6-69可知，模型5的P＜0.05，决定系数R²为0.7654。尽管模型5的决定系数较低，但是P＜0.05，说明模型5具有一定的统计学意义。

表6-68 巴豆醛模型5回归系数P检验

表6-69 巴豆醛模型5性能指标

如图6-63所示，根据模型5计算的拟合值与实际测定值的线性相关线斜率为0.9905，R²为0.808，说明模型5拟合值与实测值吻合度较好。由拟合误差图6-64可知，拟合值与观测值之间的误差大多分布在± 4μg/支这个范围内，且没有任何趋势，说明建立的模型是好的。

图6-63 巴豆醛模型5内部验证图

图6-64 巴豆醛模型5内部验证残差图

（6）巴豆醛预测模型优选通过P检验的巴豆醛预测模型共计5个，各预测模型参数见表6-70。从表中看出，模型1、2和3的R²均在0.8以上，说明上述3个模型回归效果较好，其中模型2的 R²最大，交叉验证标准差RMSECV值最小，因此选择模型2作为巴豆醛最优预测模型。

表6-70 巴豆醛预测模型

8. 苯酚预测模型

苯酚的烤烟型预测模型建立采用了单因素和多因素设计的88个样品，释放量范围：5.7～17.2 μg/支，建立预测模型过程如下：

（1）模型1：5因素线性模型采用多元线性回归法建立了苯酚与5项指标的预测模型，模型及模型参数如下：

Y=31.26-0.1584X₁-0.03553X₂-8.320E-5X₃-0.004651X₄-0.002446X₅

如表6-71所示，模型1各系数P均小于0.05，说明模型1的各系数能够通过检验。如表6-72所示，模型1的P＜0.05，决定系数R²为0.8553，说明模型1能够通过检验，有统计学意义。

表6-71 苯酚模型1回归系数P检验

表6-72 苯酚模型1性能指标

如图6-65所示，根据模型1计算的拟合值与实际测定值的线性相关线斜率为0.9937，R²为0.8319，说明模型1拟合值与实测值吻合度较好。由拟合误差图6-66可知，拟合值与观测值之间的误差大多分布在± 2μg/支这个范围内，且没有任何趋势，说明建立的模型是好的。

图6-65 苯酚模型1内部验证图

图6-66 苯酚模型1内部验证残差图

（2）模型2：5因素二次多项式模型采用逐步回归法建立了苯酚与5项指标及其交叉项和二次项的预测模型，模型及模型参数如下：

Y=53.71-0.9237X₁-0.01037X₄-0.007591X₅+0.0001989X₁X₄+0.0001676X₁X₅-0.00002863X₂X₄-0.000006178X₂X₅-0.0000002760X₃X₄+0.0000007638X₄X₅

如表6-73所示，模型2中X₄X₅的系数P为0.1435，说明本模型中X₄X₅系数的可靠性稍差，但如表6-74所示，模型2的P＜0.05，决定系数R²为0.9093，说明模型2能够通过检验，有统计学意义。

如图6-67所示，根据模型2计算的拟合值与实际测定值的线性相关线斜率为0.996，R²为0.9006，说明模型2拟合值与实测值吻合度较好。由拟合误差图6-68可知，拟合值与观测值之间的误差大多分布在± 2μg/支这个范围内，且没有任何趋势，说明建立的模型是好的。

表6-73 苯酚模型2回归系数P检验

表6-74 苯酚模型2性能指标

图6-67 苯酚模型2内部验证图

图6-68 苯酚模型2内部验证残差图

（3）模型3：5因素多因子及互作项模型采用逐步回归法建立了苯酚与5项指标及其交叉项的预测模型，模型及模型参数如下：

Y=53.71-0.9237X₁-0.01037X₄-0.007591X₅+0.0001989X₁X₄+0.0001676X₁X₅-0.00002863X₂X₄-0.000006178X₂X₅-0.0000002760X₃X₄+0.0000007638X₄X₅

如表6-75所示，模型3中X₄X₅的系数P值为0.1435，说明本模型中X₄X₅系数的可靠性稍差，但由表6-76可知，模型3的P＜0.05，决定系数R²为0.9093，说明模型3能够通过检验，有统计学意义。

表6-75 苯酚模型3回归系数P检验

表6-76 苯酚模型3性能指标

如图6-69所示，根据模型3计算的拟合值与实际测定值的线性相关线斜率为0.996，R²为0.9006，说明模型3拟合值与实测值吻合度较好。由拟合误差图6-70可知，拟合值与观测值之间的误差大多分布在± 2μg/支这个范围内，且没有任何趋势，说明建立的模型是好的。

图6-69 苯酚模型3内部验证图

图6-70 苯酚模型3内部验证残差图

可以看出，模型2和模型3是一致的，这是由于在做二次多项式回归计算过程中各因素的平方项影响较小而被剔除，因此导致模型2和模型3一致。

（4）苯酚预测模型优选通过P检验的苯酚预测模型共计3个，各预测模型参数见表6-77。从表中看出，模型2的 R²最大，交叉验证标准差RMSECV值最小，因此选择模型2（模型2和模型3一致）作为苯酚最优预测模型。

表6-77 苯酚预测模型

9. 苯并 [a] 芘预测模型

苯并 [a] 芘的烤烟型预测模型建立采用了单因素和多因素设计的88个样品，释放量范围：6.5～17.5 ng/支，建立预测模型过程如下：

（1）模型1：5因素线性模型采用多元线性回归法建立了苯并 [a] 芘与5项指标的预测模型，模型及模型参数如下：

Y=22.58-0.04937X₁-0.05075X₂-1.002E-4X₃-0.003791X₄-0.001170X₅

从表6-78看出，模型1中X₁系数b₁的P值为0.0621，说明本模型中X₁系数的可靠性稍差，但由表6-79可知，模型1的P＜0.05，决定系数R²为0.9158，说明模型1能够通过检验，有统计学意义。

表6-78 苯并 [a] 芘模型1回归系数P检验

表6-79 苯并 [a] 芘模型1性能指标

如图6-71所示，根据模型1计算的拟合值与实际测定值的线性相关线斜率为0.9937，R²为0.8319，说明模型1拟合值与实测值吻合度较好。由拟合误差图6-72可知，拟合值与观测值之间的误差大多分布在± 1.5ng/支这个范围内，且没有任何趋势，说明建立的模型是好的。

图6-71 苯并 [a] 芘模型1内部验证图

图6-72 苯并 [a] 芘模型1内部验证残差图

（2）模型2：5因素二次多项式模型采用逐步回归法建立了苯并 [a]芘与5项指标及其交叉项和二次项的预测模型，模型及模型参数如下：

Y=30.06-1.089X₁-0.1553X₂-0.006636X₄+0.003897X₅+0.01292X₁X₁+0.001032X₂X₂+0.000000006589X₃X₃+0.0000008454X₄X₄-0.0000007870X₅X₅+0.00005650X₁X₅+0.00001635X₂X₄-0.0000001607X₃X₄-0.00000003647X₃X₅+0.0000005614X₄X₅

如表6-80所示，模型2中X₅、 X₁X₁、 X₁X₅的系数P大于0.05，说明本模型中X₅、 X₁X₁、 X₁X₅系数的可靠性稍差，但由表6-81可知，模型2的P＜0.05，决定系数R²为0.9670，说明模型2能够通过检验，有统计学意义。

如图6-73所示，根据模型2计算的拟合值与实际测定值的线性相关线斜率为0.999，R²为0.9659，说明模型2拟合值与实测值吻合度较好。由拟合误差图6-74可知，拟合值与观测值之间的误差大多分布在±1ng/支这个范围内，且没有任何趋势，说明建立的模型是好的。

表6-80 苯并 [a] 芘模型2回归系数P检验

表6-81 苯并 [a] 芘模型2性能指标

图6-73 苯并 [a] 芘模型2内部验证图

图6-74 苯并 [a] 芘模型2内部验证残差图

（3）模型3：5因素多因子及互作项模型采用逐步回归法建立了苯并[a] 芘与5项指标及其交叉项的预测模型，模型及模型参数如下：

Y=22.71-0.04777X₁-0.05064X₂-0.004843X₄-0.001267X₅-0.0000001286X₃X₄-0.00000001372X₃X₅+0.0000004664X₄X₅

如表6-82所示，模型3中X₁和X₄X₅的系数P＞0.05，说明本模型中X₁和X₄X₅系数的可靠性稍差，但由表6-83可知，模型3的P＜0.05，决定系数R²为0.9300，说明模型3能够通过检验，有统计学意义。

表6-82 苯并 [a] 芘模型3回归系数P检验

表6-83 苯并 [a] 芘模型3性能指标

如图6-75所示，根据模型3计算的拟合值与实际测定值的线性相关线斜率为0.9978，R²为0.9249，说明模型3拟合值与实测值吻合度较好。由拟合误差图6-76可知，拟合值与观测值之间的误差大多分布在± 1ng/支这个范围内，且没有任何趋势，说明建立的模型是好的。

图6-75 苯并 [a] 芘模型3内部验证图

图6-76 苯并 [a] 芘模型3内部验证残差图

（4）苯并 [a] 芘预测模型优选通过P检验的苯并 [a] 芘预测模型共计3个，各预测模型参数见表6-84。从表中看出，3个模型的R²均在0.9以上，说明3个模型回归效果很好，其中模型2的R²最大，交叉验证标准差RMSECV值最小，因此选择模型2作为苯并 [a] 芘最优预测模型。

表6-84 苯并 [a] 芘预测模型

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈

卷烟材料影响有害成分预测模型的建立

卷烟纸定量对烟气有害成分的影响分析

卷烟纸助燃剂对烟气有害成分的影响

卷烟纸纤维组成对烟气有害成分的影响研究

滤嘴长度对烟气有害成分的影响

丝束规格对烟气有害成分的影响

烟用材料多因素影响预测模型优化方案

特种滤棒对烟气有害成分的影响分析

接装纸长度对烟气有害成分的影响分析

相关推荐