* 第十章 回归分析

* 第十章 回归分析

在客观世界中,变量间总是相互联系、相互依存的.变量之间的关系可以分成两种类型:一种类型是变量间具有确定性的函数关系.例如,物体做自由落体运动时下落高度s与下落时间t之间有关系式,这里s与t之间就存在确定性的关系.另一种类型是变量间不具有确定性的关系但有统计规律性.下面举例说明.

(1)人的血压与年龄的关系.一般说来,年龄越大的人血压越高,但相同年龄的人的血压又会有所不同.

(2)人们常说“肥多粮多”,就是说在一定条件下,粮食亩产量与所施肥料之间存在一定的关系.但这关系是非确定性的,即使同时在同一地区的两块同等条件的土地上施用同样多的某种肥料,其粮食产量也不一定相同.

(3)在平炉炼钢过程中,一炉钢在冶炼初期中总的去碳量Y与天然矿石加入量X1,烧结矿石加入量X2及熔化时间X3的关系.Y与X1,X2,X3有关,但X1,X2和X3即使相同,Y的值也可能不同.

在上面这些例子中,自变量取确定值时,因变量的值是不确定的,但两者有一定联系.这种变量间的非确定关系称为相关关系.可以在某个范围内随意地取指定值的变量,称为可控变量.如上述例子中的年龄,施肥量及炼钢中的一些矿石加入量X1,X2,X3等都是可控变量.本章恒假定自变量是可控变量.

另一方面,即便是具有确定关系的变量,由于试验误差的影响,其表现形式也具有一定的不确定性.

当自变量是可控变量,因变量是随机变量时,变量间关系的分析称为回归分析.只有一个自变量的回归分析称为一元回归分析,有多个自变量的回归分析称为多元回归分析.本章重点介绍一元回归分析,简单介绍多元回归分析以及可线性化的一元回归分析.