一、回归分析

一、回归分析

(一)回归分析的概念

回归分析是指对存在相关关系的变量,根据其相关关系的形态,选择一个恰当的函数关系或数学模型,即回归模型,来近似地表示变量之间的平均变化关系的一种统计分析方法。通过回归分析,可将相关变量之间的不确定、不规则的数量关系一般化、规则化,进而通过规定自变量和因变量来确定变量之间的影响程度。通常采用的方法是对实测数据配合直线或曲线,用这一直线或曲线来代表变量之间的一般数量关系,这条直线或曲线叫回归直线或回归曲线,其方程式叫直线回归方程或曲线回归方程。通过实测数据来求解模型的各个参数,然后评价回归模型是否能够很好地拟合实测数据;如果能够很好地拟合,则可以根据自变量做进一步预测。

(二)回归分析的特点

1.进行回归分析时,需要确定自变量和因变量

在进行相关分析时,由于是分析变量之间的关系,没有设定自变量和因变量。与相关分析相比,在进行回归分析时,确定出一个数学方程,所以必须根据研究对象的不同性质和研究分析的不同目的,通过定性分析来确定哪个是自变量,哪个是因变量,还要研究自变量对因变量的影响程度。

2.进行回归分析时,回归方程不止一个

相关关系属于模糊关系,没有区分自变量和因变量,但现象之间的相关关系是确定的。回归分析用于确定因果关系,根据不同的研究目的,确定自变量和因变量(可以相互转换),可以求出y 依x 的回归方程,还可以求出x 依y 的回归方程,即回归方程不止一个。

3.进行回归分析时,结果具有不确定性

在进行回归分析时,自变量和因变量之间的相关关系通过一个数学方程来表达,自变量取值是给定的具体数值,因变量值则是随机的,对于给定的自变量的数值,因变量会有多个不确定数值,如对于一个给定的施肥量,会有不同产量。将自变量的给定值代入回归方程后,所得到的是因变量估计值;而且在进行相关分析时,涉及的自变量取值与因变量取值是随机的,不确定的。

(三)回归分析的种类

1.根据所研究问题的性质,分为一元回归分析和多元回归分析

一元回归分析模型是指只由一个自变量和一个因变量组成的回归分析模型,又称简单回归分析模型。

多元回归分析模型是指由两个或两个以上自变量和一个因变量组成的回归分析模型,与简单回归分析模型相比,增加了自变量的个数。

2.根据表达式是线性的还是非线性的,分为线性回归分析和非线性回归分析

线性回归分析模型是指反映变量之间相关关系的形态为直线趋势的模型。

非线性回归分析模型是指反映变量之间相互关系的形态为某种曲线趋势的模型。

以下就一元线性回归分析加以重点介绍,其他将在项目九中介绍。