(一)回归分析的概念
回归这个术语是由英国著名统计学家Francis Galton在19世纪末期研究孩子及他们的父母的身高时提出来的。Galton发现身材高的父母,他们的孩子也高。但这些孩子平均起来并不像他们的父母那样高。对于比较矮的父母情形也类似:他们的孩子比较矮,但这些孩子的平均身高要比他们的父母的平均身高高。Galton把这种孩子的身高向中间值靠近的趋势称之为一种回归效应,而他发展的研究两个数值变量的方法称为回归分析。
为了说明变量之间的相关关系,可以用相关系数加以反映。但是,相关系数仅能说明相关关系的方向和紧密程度,而不能说明变量之间的因果数量关系。当给出自变量某一数值时,不能根据相关系数来估计或预测因变量可能发生的数值。回归分析就是对具有相关关系的变量之间数量变化的一般关系进行测定,确定一个相关的数学表达式,以便于进行估计或预测的统计方法。
相关关系是一种数量关系不严格的相互依存关系。现在根据这些数量关系不严格、不规则的材料找出现象的规则来,方法就是配合直线或配合曲线。用一条直线来代表现象之间的一般数量关系,这条直线在数学上叫做回归直线,表现这条直线的数学公式称为直线回归方程;用曲线来代表现象之间的一般数量关系,这条曲线在数学上叫做回归曲线,表现这条曲线的数学公式称为曲线回归方程。
回归这个统计术语,最早采用者是英国遗传学家高尔登,他把这种统计分析方法应用于研究生物学的遗传问题,指出生物后代有回复或回归到其上代原有特性的倾向。高尔登的学生皮尔逊继续研究,把回归的概念和数学方法联系起来,把代表现象之间一般数量关系的直线或曲线称为回归直线或回归曲线。
(二)回归分析与相关分析的区别与联系
相关分析与回归分析既相互区别又密切联系,是相辅相成的。
1.回归分析与相关分析的区别
(1)相关分析是研究两个或两个以上变量之间相关关系及其密切程度的分析。判断相关关系及其密切程度,一般可通过进行定性与定量分析、编制相关图表、计算相关系数等,来反映相关方向和密切程度。回归分析是指将相关现象的关系转变为函数关系,并建立变量关系的数学表达式,来研究变量之间数量变动关系的统计分析方法。(www.daowen.com)
(2)相关分析所研究的两个变量之间是对等关系。回归分析所研究的两个变量不是对等关系,必须根据研究目的,确定其中的自变量和因变量。
(3)对于变量x与y来说,相关分析职能计算出一个反映两个变量间相关密切程度的相关系数,计算中改变x和y的地位不影响相关系数的数值。回归分析有时可以根据研究目的的不同,分别建立两个不同的回归方程。以x为自变量,y为因变量,确定的回归方程称为y对x的回归方程;以y为自变量,x为因变量,确定的回归方程称为x对y的回归方程。
(4)相关分析对资料的要求是,两个变量都是随机的,也可以是一个变量是随机的,另一个变量是非随机的。而回归分析对资料的要求是,自变量是可以控制的变量(给定的变量),因变量是随机变量。
2.回归分析与相关分析的联系
(1)相关分析是回归分析的基础和前提。假若对所研究的客观现象不进行相关分析,直接做回归分析,则这样建立的回归方程往往没有实际意义。只有通过相关分析,确定客观现象之间确实存在数量上的依存关系,而且其关系值又不确定的条件下,再进行回归分析,在此基础上建立回归方程才有实际意义。
(2)回归分析是相关分析的深入和继续。对所研究现象只做相关分析,仅说明现象之间具有密切的相关关系是不够的,统计上研究现象之间的具有相关关系的目的,就是要通过回归分析,将具有依存关系的变量间的不确定的数量关系加以确定,然后由已知自变量的值推算未知因变量的值,只有这样,相关分析才具有实际意义。
相关分析和回归分析是研究现象之间互相依存关系的不可分割的两个方面。一般先进行相关分析,测定相关现象之间相关程度的大小,进而决定是否需要进行回归分析,并拟合相应的回归方程,以便进行推算和预测等,因而可以说相关分析是进行回归分析的基础,回归分析是把变量的相关关系转变为函数关系的手段。但需指出,相关分析可以不分自变量和因变量,而进行回归分析时,则必须明确自变量和因变量,当自变量与因变量位置互换时所得到的回归方程则不同。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。