小结
回归分析是数理统计中极为重要的组成部分,在系统辨识、模拟、预测、控制等方面,在生产、科技、经济、管理、生物、医药等很多领域都有广泛的应用.本章重点介绍“一元线性”回归模型及有关它们最基本的知识,使学生对回归分析的概念有基本的了解,它的思想和方法可推广到多元、非线性等其他数学模型.
知道回归分析的基本概念,了解一元线性回归,会求回归模型系数的估计.回归分析是由一个或多个非随机变量去估计或预测一个随机变量的观测值所建立的数学模型及所进行的统计分析,是处理多个变量之间相互关系的一种数学方法,可分为一元线性回归与多元线性回归,以及可化为线性回归的一元非线性回归.回归分析是在一组试验或观测数据的基础上,寻找被随机性掩盖了的变量之间的依存关系;粗略地讲,可以理解为用一种确定的函数关系去近似代替比较复杂的相关关系,这个函数称为回归函数,在实际问题中称为经验公式,并给出相关性检验规则,运用经验公式达到预测与控制目的.在回归分析中,这种方法是处理变量间相关关系的有力工具,我们不仅可以建立变量间的数学表达式,还可判断所建立公式的有效性,可以进行预测或估计.
当具有相关关系的两个变量y和x不具有线性相关关系,而具有某种曲线相关关系时,可以通过适当的变量代换,将变量间的关系化为线性的形式,即通过必要的变量转换对它做线性化处理.在两个变量回归的条件下,一般常用的是倒数变换与对数变换,使曲线问题化为变换后的直线问题.所处理的自变量与因变量间的关系,也可以是双曲函数、幂函数、指数函数、负指数函数、对数函数等.更复杂的曲线回归,将利用多元线性回归方法来解决.
正确选择曲线类型,是正确地进行变量转换的前提,而正确的转换关系又是提高曲线回归精确度的根本.由散点图的形状选择的线性化转换,往往不能一次就选准.为准确起见,不妨同时作几种曲线加以比较.
一元线性回归的解题过程:(1)建立观测结果(x1,y1),(x2,y2),…,(xn,yn)的散点图,确定y对x的相依关系的特点;(2)估计回归系数a,b和方差σ2;(3)检验回归方程的回归效果是否显著;(4)利用回归方程进行预测与控制.在计算数据过程中,要注意利用数据处理的一些技巧,以减轻计算工作量.
最后我们指出,回归分析特别是多元回归分析,其计算量很大,一般需用计算机进行计算,已经有许多软件可以进行这方面的计算,参看本书附录(MATLAB中的概率统计).