理论教育 回归分析:概念与特点 -统计学

回归分析:概念与特点 -统计学

时间:2023-08-04 理论教育 版权反馈
【摘要】:回归分析的两个变量是非对等关系。数学模型是现象间相关关系进行回归分析的数量描述形式,模型拟合的精度,直接影响统计分析结论的准确性。线性回归分析模型是指反应变量之间关系为线性趋势的模型。由于线性回归分析是整个回归分析的基础,因此本书重点介绍。

回归分析:概念与特点 -统计学

1.回归分析的含义

我们已知道,通过相关分析可以说明变量之间相关关系的方向和程度,但是它不能说明变量之间具体的数量因果关系。也就是说,当自变量给出一个数值时,因变量的可能取值是多少,这恰恰是相关分析所不能回答的问题。这就需要通过新的统计分析方法,即回归分析加以解决。

所谓回归分析,是指对具有相关关系的现象,根据其关系形态,选择一个合适的数学模型(称为回归方程),用来近似地表示变量间的一般数量关系,也即平均变化关系的一种统计分析方法。回归分析的基本思想是,根据现象间相关关系的形态,配合一条近似函数关系的最合适的直线或曲线,用这条直线或曲线,反映它们之间数量变化的一般关系,即当自变量发生一个量的变化时,因变量一般会(或平均会)发生多大量的变化。例如,单位面积化肥施用量增加1 千克,粮食单产会增加多少千克;某产品产量每增加1 000 件,单位成本平均会下降多少元等。反映现象间相关关系数量变化规律的直线或曲线,称为回归直线或曲线;表现这条回归直线或曲线的数学表达式,称为直线或曲线回归模型。它是推算或预测因变量的经验数据模型。

★相关链接

“回归”一词是19 世纪英国生物学家高尔登(Francis Galton,1822—1911)首先提出的。他在研究父母身高和子女身高的关系时发现,身材特别高的父母所生的孩子并不一定特别高,而身材特别矮的父母所生的孩子并非特别矮,子辈的身高有向父辈平均身高逼近的趋势,他把这种现象称为“身高数值从一个极端向另一极端的回归”。此后,他的学生皮尔逊(Karl Pearson,1857—1936)把回归的概念与数学的方法联系起来,把代表现象之间一般数量关系的统计模型叫作回归直线或回归曲线,从此便诞生了统计上著名的回归理论。后来,回归这一名词被用来泛指变量之间的一般数量关系。

2.回归分析的特点

与相关分析相比,回归分析有以下特点(或区别)。

(1)回归分析的两个变量是非对等关系。在相关分析中,相关关系的两个变量是对等的,只要求变量存在相关关系,不必区分哪一个是自变量、哪一个是因变量。而回归分析中,两个变量存在因果关系,所以需要先通过定性分析来确定哪个是自变量、哪个是因变量。自变量、因变量不同,所得出的分析结果也不同。一般而言,回归现象中的变量一定相关,但相关的两个变量不一定有回归现象。

(2)在回归分析中,因变量是随机变量,而自变量是可控制的变量。可依研究的目的分别建立y 对于x 的回归方程或x 对于y 的回归方程;而相关分析中,被研究的两个变量都是随机变量,它只能计算出反映两个变量之间相关密切程度的一个统计分析指标,即相关系数

(3)回归分析主要是通过对一组样本数据的分析,确定出变量之间的数学关系式,对其可靠程度进行检验,通过关系式确定影响因变量的主次因素,并利用所得的关系式对因变量进行预测估计。而相关分析是对两个变量之间关系的描述,利用相关系数来测定变量之间关系的密切程度。

显然,回归分析与相关分析存在着明显的区别。当然,两者也有着密不可分的内在联系,首先,相关分析是回归分析的基础和前提。如果现象间缺少相关关系,而又没有从定性上说明现象间是否具有相关关系,未能对现象间相关关系的密切程度做出判断,是不能进行回归分析的,即便勉强进行回归分析,也是毫无实际意义的。其次,回归分析是相关分析的深入和继续。因为,统计实践已经证明,仅仅说明现象间具有密切的相关关系是不能满足统计研究需要的,只有将变量值的分布回归,并拟合相应的回归方程,才能进行有关的推算和回归预测,相关分析也才具有实际意义。(www.daowen.com)

总之,如果仅有回归分析而缺少相关分析,将会缺乏必要的基础和前提而影响回归分析的可靠性;如果仅有相关分析而缺少回归分析,就会削弱相关分析的意义。只有将两者结合起来才能达到统计分析的目的。

3.回归分析的内容

回归分析是指将具有相关关系的现象的变量转变为函数关系,并建立变量关系的数学表达式,来研究变量之间数量变动关系的统计方法。具体内容包括两个方面。

(1)确定现象之间相关关系的数学模型。回归分析的目的之一就是要根据某一现象的变动对另一现象的变动做出数量上的判断,测定变量间的一般数量变化关系,即建立描述现象间相关关系的数学模型——回归方程,用函数关系式近似地表达相关关系,进而找出现象间相互依存关系数量上的规律性,作为判断、推算、预测的根据。

(2)测定数学模型的拟合精度。数学模型是现象间相关关系进行回归分析的数量描述形式,模型拟合的精度,直接影响统计分析结论的准确性。

4.回归分析的种类

按照统计研究对象和目的的不同,回归分析模型可进行以下分类。

(1)按照具有相关关系的变量个数多少划分,可分为简单回归分析模型和多元回归分析模型。简单回归分析模型是指只有一个自变量和一个因变量的回归分析模型。多元回归分析模型是指由多个自变量和一个因变量组成的回归分析模型。它与简单回归分析模型相比,增加了自变量的个数。

(2)按照变量间相互关系的形态来分,可分为线性回归分析模型和曲线回归分析模型。线性回归分析模型是指反应变量之间关系为线性趋势的模型。曲线回归分析模型是指反映变量之间相互关系的形态表现为某种曲线的模型。

将上述分类交叉使用,就得到简单线性回归、简单曲线回归、多元线性回归和多元曲线回归四种类型。由于线性回归分析是整个回归分析的基础,因此本书重点介绍。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈