根据n组样本数据,利用最小二乘估计得到的回归系数b与0是否有显著性差异,同是变量y与变量x之间是否有线性关系,都需要进行统计检验。
(一)回归系数的显著性检验
从上式y=a+bx+ε可知,如果b=0,则x对y的线性影响作用不显著,即认为x与y不存在线性关系,一元线性回归数学模型不成立;反之,线性影响作用显著,所建立的一元线性回归方程可以认为是能够反映变量之间的线性关系。所以需要对回归系数进行与0是否有显著性差异的统计检验。其检验过程如下:
1.建立假设
H0∶b=0;H1∶b≠0
2.选择统计量
3.根据给定的显著性水平和自由度,查找t分布表中相应的临界值
4.计算上述的统计量并与查表的值进行比较,若,则拒绝原假设H0,这样认为,变量间存在线性关系;若,则不能拒绝原假设H0,可以认为变量间的线性关系不存在。
【例6-4】仍以表6-7的数据为例来检验回归系数的显著性。
解:由例6-3可知,估计出来的回归方程是
1.建立假设
H0∶b=0;H1≠0
2.选择统计量t0.025(18)=2.1。
4.计算上述的统计量18.08,显然t^b>tα/2则拒绝原假设H0,这样认
3.根据给定的显著性水平和自由度,查找t分布表中相应的临界值为,变量间存在线性关系。
(二)回归方程的拟合检验
线性回归方程概括地描述了变量x与y之间的关系,但这种关系是强还是弱,方程本身解决不了。要取决于直线对这种关系描述的好坏,即各观察点聚集在回归直线周围的紧密程度,这种紧密程度称为回归直线对样本数据的拟合程度。在一元回归分析中,对于每次观察的样本数据来说,因变量yi之间的差异的大小可以用实际观察值yi与其平均值之间的差来表示,所有样本数据的总离差可以用这些离差的平方和表示,成为总离差平方和,用SST表示,每个样本数据yi与的离差可以分解为两部分,如图6-4所示。
图6-4 总离差分解示意图
这样可得:
式中,称为回归离差,反映回归值与样本的平均值之间的离差大小称为剩余离差,反映样本数据与其相应的回归值之间的离差大小,即残差。
同时,还可以得到:(www.daowen.com)
若以SSR和SSE分别表示回归离差平方和与残差平方和,则有SST=SSR+SSE。
定义
R2为可决系数。若样本数据全部落在回归直线上,则可决系数是1;若样本数据里回归直线很远,则可决系数接近于0。因而可决系数在0与1之间。越接近于1,回归直线对样本数据的拟合程度越高。
【例6-5】仍以表6-6的数据为例来计算销售额与广告费用回归的可决系数,说明拟合优度。
解:
可决系数为0.95,也可以说产品销售额的总离差中归因于x与y之间直线关系的比例是95%。
(三)回归方程的显著性检验
x与y之间是否真正存在线性关系,除了可用回归系数的显著性检验外,还可以方差分析为基础进行检验,即回归方程的显著性检验,也称F检验。
总离差平方和可分解为回归离差平方和与剩余离差平方和,即SST=SSR+SSE。每一个平方和都有一个自由度,总离差平方和SST的自由度是(n-1);回归离差平方和SSR的自由度是1,因为只有一个自变量;剩余离差平方和的自由度是(n-2)。方差分析见表6-8所示。
表6-8 一个自变量线性回归的方差分析表
F检验的步骤是:
(1)假设回归方程不显著,即H0表示回归方程不显著;H1表示回归方程不显著。
(2)计算回归方程的F统计量。
(3)根据给定的显著性水平α以及两个自由度1和(n-2),查F分布表中相应的临界值Fα(1,n-)2并进行判断:若F>Fα(1,n-)2,则拒绝原假设,即线性方程显著,反之,则不能证明线性方程显著。
【例6-6】仍以表6-6的数据为例来计算销售额与广告费用之间的线性方程进行显著性检验。
解:提出假设
即H0:回归方程不显著;H1:回归方程显著
设显著性水平是5%,查F分布表得:F0.05(1,18)=4.414,因此,F>Fα(1,n-2),所以拒绝原假设,即产品销售额与广告费用之间的线性回归方程显著。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。