一、回归分析概述

一、回归分析概述

自然界中许多变量间都存在着某种相互联系和相互制约的关系,这种关系一般有两类,一类是确定性关系,也称为函数关系.如y=2x+1中变量x与y的关系就是确定性关系.另一类是不确定性关系,也称为相关关系或统计关系.这种变量间的关系尚无法表示成精确的函数关系,如人的身高与体重的关系;商品的销售量与价格的关系;树高与生长时间的关系等均属于这类关系.

所谓回归分析,是指通过试验和观测,去寻找隐藏在变量间的统计关系的一种数学方法.设我们要研究变量y与x之间的统计关系,希望找出y的值是如何随x的变化而变化的规律,这时称y为因变量,x为自变量.通常x被认为是非随机变量,它是可以精确测量或严格控制的;y是一个随机变量,它是可观测的,但存在测量误差.于是y与x的关系可表示为

图示

其中ε是一切随机因素影响的总和,有时也简称为随机误差.通常假设ε满足

图示

方程(7.21)称为理论回归方程.由于f(x)的函数形式未知,或者f(x)的函数形式已知,但其中含有未知参数,即f(x;β0,β1,…,βl),其中β0,β1,…,βl为未知参数.故理论回归方程一般无法直接写出.(https://www.daowen.com)

为了得到理论回归方程的近似表达式,通常先对f(x)的函数形式做出假定,然后通过观测得到关于(x,y)的n组独立观测数据(xi,yi)(i=1,2,…,n).利用这些观测数据来估计出f(x;β0,β1,…,βl)中的未知参数,得到经验回归方程

图示

方程(7.22)又称为回归方程,f(x)称为y对x的回归函数.当f(x)是线性函数时,方程(7.22)称为线性回归方程,而获得线性回归方程的方法称为线性回归分析.

若所进行的线性回归分析中自变量是一元的,则称之为一元线性回归分析;若自变量是多元的,则称之为多元线性回归分析.

回归分析在数学建模中的应用非常广泛,其主要作用有:

(1)根据所给的数据,在误差尽可能小的条件下,建立因变量y与自变量x1,x2,…,xm之间的回归方程,并利用此方程对变量y进行预测或控制;

(2)判断自变量x1,x2,…,xm中,哪些变量对y的影响是显著的,哪些变量的影响是不显著的;

(3)估计多项式插值函数的系数.