小结
方差分析是数理统计学中常用的数据处理方法之一,是工农业生产和科学研究中分析试验数据的一种有效的工具,也是开展试验设计、参数设计的数学基础.一个复杂的事物,其中往往有许多因素互相制约又互相依存.方差分析的目的是通过数据分析找出对该事物有显著影响的因素、各因素之间的交互作用,以及显著影响因素的最佳水平等.
方差分析并不是真正研究方差,而是研究变异(即离散程度),是在可比较的数组中,把数据间的总的变异按各指定的变异来源进行分解的一种技术.对变异的度量,采用偏差平方和.方差分析方法就是从总偏差平方和分解出可追溯到指定来源的部分偏差平方和,通过各变异来源的均方与误差均方比值的大小,借助分布做出统计推断,判断各因素对各组均数有无影响,这是一个很重要的思想.本章仅介绍有关方差分析的最基本的知识(试验指标、因素、水平、单因子试验、双因子试验、交互作用),使学生对方差分析的概念(总偏差平方和及其分解、因素效应平方和、误差平方和、交互效应平方和)有基本的了解.
方差分析的种类很多,不同类型的方差分析中,因素可以增加或减少,数据结构可以发生变化,但是三个重要的假定是不变的.
(1)正态性假定:有了正态性假定后,数据xij认为取自N(μ,σ2),由此求得的各种离差平方和(如比值ST/σ2)~χ2分布,从而定义F分布函数.没有正态假定,就没有χ2分布,也没有F分布与统计推断.
(2)方差齐性假定:假定数据xij来自方差为σ2的正态总体,只有这样才能在相同的条件(σ2相等)下来分析问题.考察指标的变化,才可以建立统计假设H0,才有方差分析检验.
(3)线性假定:线性假定是指数据xij的取得仅通过线性运算,因而才可以把数据xij当线性模型处理,也才可以施行方差分析方法.
在大数定律和中心极限定理下,正态性假设是易于确立的,数据的线性假设也符合实际,易于成立.但是,方差齐性假设不易确立,常常用数据的变换来实现,计算比较复杂.在方差分析中,三个假定缺一不可,否则方差分析就失去了依据.
在实际问题中,影响指标的因素往往是很多的,这就需要我们根据问题的性质、对问题的了解和研究的规模确定因素的取舍.即只研究其中哪几个(或一个)因素,将因素分几个水平,怎样区分水平.为了研究方便且突出结论,一般只让一个或两个因素变化,而把其他因素固定起来.这样观察和分析指标的变化和因素的影响,就得到单因素和双因素方差分析.