理论教育 多元线性回归模型的检验方法

多元线性回归模型的检验方法

时间:2023-06-09 理论教育 版权反馈
【摘要】:(一)拟合优度的检验多元线性回归分析中,普通最小二乘法所保证的最好拟合,仍是同一个问题内部的比较,比较不同问题之间的优劣,仍需要检验拟合优度。在多元线性回归分析中,总离差平方和的分解公式仍然成立。(三)显著性检验在一元线性回归中,整个方程线性关系的检验(F检验)与回归系数的检验(t检验)是等价的。但是在多元线性回归中,这两个检验不再等价。

多元线性回归模型的检验方法

(一)拟合优度的检验

多元线性回归分析中,普通最小二乘法所保证的最好拟合,仍是同一个问题内部的比较,比较不同问题之间的优劣,仍需要检验拟合优度。在多元线性回归分析中,总离差平方和的分解公式仍然成立。因而上一节定义的判定系数的计算公式(6.6)在这里仍成立。

但是,从(6.6)式可以看出,拟合优度的大小取决于残差平方和SSE在总离差平方和SST中所占的比重。在样本容量一定的条件下,总离差平方和与自变量的个数k无关,但是当自变量的个数增加时,可能会使预测误差变小,从而减少残差平方和(至少不会增加),这样拟合优度是自变量个数k的非递减函数。在一元线性回归模型中,不同的模型都仅含有一个自变量,如果使用的样本容量也一样,判定系数便可以直接作为评价拟合优度优劣的尺度。然而,在多元线性回归模型中,不同的模型所包含的自变量个数未必相同,如果在模型中额外增加一个自变量,即使这个自变量没有经济意义,在统计上也不显著,拟合优度仍可能变大。因此,R2不适合作为衡量拟合优度的尺度。为了避免增加自变量而高估R2,引进了修正自由度的判定系数,其计算公式为:

由于修正自由度的判定系数考虑了样本容量和模型中的参数的个数,这样使得修正的判定系数永远小于原判定系数。

(二)估计标准误差

同一元线性回归一样,多元线性回归中的估计标准误差也是对误差项的方差的一个估计值,它在衡量多元线性回归方程的拟合优度方面也起重要作用。其计算公式:

多元线性回归中对估计标准误差的解释与一元线性回归类似,由于估计标准误差所估计的是预测误差的标准差,其含义是:根据自变量x1,x2,…,xk来预测因变量Y的平均预测误差。

(三)显著性检验

在一元线性回归中,整个方程线性关系的检验(F检验)与回归系数的检验(t检验)是等价的。但是在多元线性回归中,这两个检验不再等价。

1.F检验

F检验主要是检验自变量同多个自变量的线性关系是否显著,在k个自变量中,只要有一个自变量同音变的线性关系显著,F检验就能通过,因此,F检验是对方程整体线性关系的检验。

F检验的具体步骤为:

第一步,提出假设:H0∶b1=b2=…=bk;H1∶b1,b2,…,bk至少有一个不等于0。

第二步,构造F统计量,并在假设条件下计算出F检验统计量。计算公式为:

第三步,做出统计决策。给定显著性水平α,根据分子自由度(k)、分母自由度(n-k-1),查F分布表得Fα。若F>Fα,则拒绝原假设;若F<Fα,则接受原假设。

2.t检验

回归系数显著性检验要采用t检验。t检验是对每个回归系数分别进行单独的检验,主要用于检验每个自变量对因变量的影响是否都显著。

t检验的具体步骤为:

(1)建立假设。

H0∶bi=0;H1∶bi≠0

(i=1,2,3,…,k)

(2)选择统计量。(www.daowen.com)

,其中

(3)根据给定的显著性水平和自由度,查找t分布表中相应的临界值

(4)计算上述的统计量并与查表的值进行比较,若,则拒绝原假设H0,这样认为,变量间存在线性关系;若,则不能拒绝原假设H0,可以认为变量间的线性关系不存在。

【例6-7】某种商品的价格指数、售后服务指出、替代产品销售量均会影响该产品的销售额,下表是三个影响因素对销售额的影响数据。试分析它们对销售额的影响。

续表

解:经Analyze—Regression—Linear菜单进入回归分析对话框。将Y选为因变量;X1、X2、X3选为自变量。点击OK。主要过程和结果如下。

Variables Entered/Removed(b)

a All requested variables entered.
b Dependent Variable:销售额

Model Summary

a Predictors:(Constant),替代品额,价格指数,售后支出

ANOVA(b)

a Predictors:(Constant),替代品额,价格指数,售后支出
b Dependent Variable:销售额

Coefficients(a)

a Dependent Variable:销售额

根据上述结果,写出多元线性回归方程:

变量X1的回归系数是-7.431,其统计含义是:在其他两个因素不变的情况下,价格指数每增加一个单位,该产品销售额“平均”下降7.431个单位;变量X2的回归系数是1.582,其统计含义是:在其他两个因素不变的情况下,售后服务支出每增加一个单位,该产品销售额“平均”上升1.582个单位;变量X3的回归系数是-0.732,其统计含义是:在其他两个因素不变的情况下,替代产品销售额每增加一个单位,该产品销售额“平均”下降0.732个单位。

回归模型的统计检验:

拟合优度评价:回归模型的修正判定系数是0.925,说明92.5%的产品销售额可以用该产品价格指数、售后服务支出和替代品销售额这三个因素来解释。说明该方程的拟合效果较好。

方程整体的显著性检验。从F统计量的计算值与给定显著性水平的F统计量值为3.55的比较后,可以判断方程的显著性可以通过。

单个参数的显著性检验。从t统计量的计算值与给定显著性水平的t统计量为2.101的比较后,可以判断X1、X2对销售额的影响是显著的;而X3对销售额的影响不能确定。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈