1.2 数理统计学的发展历史

1.2 数理统计学的发展历史

数理统计学是伴随着概率论的发展而发展起来的,在19世纪中叶以前已出现了若干重要的成果,如约翰·卡尔·弗里德里希·高斯(Johann Carl Friedrich Gauss)和A.M.勒让德(Adrien-Marie Legendre)关于观测数据误差分析和最小二乘法的研究。到19世纪末期,经过包括卡尔·皮尔逊(Karl Pearson)在内的一些学者的努力,数理统计学这门学科已开始形成。但数理统计学发展成一门成熟的学科则是20世纪上半叶的事,到20世纪初,卡尔·皮尔逊提出了卡方分布,他被公认为现代统计学的奠基人之一。他和弗朗西斯·高尔登(Francis Galton)创建了《生物统计》期刊,无论是在统计学研究方面,还是在人才培养方面,两人都做出了很大的贡献。卡尔·皮尔逊在伦敦大学主理“高尔登试验室”事务多年,该试验室在20世纪初是国际上一个重要的统计学研究教学中心。另外,罗纳德·爱尔默·费希尔(R.A.Fisher)的贡献对这门学科的建立也起了决定性的作用。1946年,H.克拉默发表的《统计学数学方法》是第一部严谨且比较系统的数理统计著作,可以作为数理统计学进入成熟阶段的标志。数理统计学的发展大致可分3个时期。

第一时期:20 世纪以前。这个时期又可分成两个阶段,大致上可以把高斯和勒让德关于最小二乘法用于观测数据的误差分析的工作作为分界线。前一阶段属于数理统计学的萌芽时期,基本上没有超出描述性统计的范围。后一阶段可算作数理统计学的幼年阶段。首先,这一阶段强调了推断的地位,而摆脱了单纯描述的性质。由于高斯等人的工作揭示了正态分布的重要性,学者们普遍认为,在实际问题中遇见的几乎所有的连续变量都可以用正态分布来刻画。这种观点使关于正态分布的统计得到了深入的发展,但延缓了非参数统计的发展。在19世纪末,卡尔·皮尔逊给出了以他的名字命名的分布,并给出了估计参数的一种方法——矩法估计,后来又提出了频率曲线的理论,并于1900年在德国大地测量学者F.赫尔梅特(F.Helmert)(1876年在研究正态总体的样本方差时,发现了十分重要的卡方分布)的基础上提出了卡方检验。

第二时期:20世纪初到第二次世界大战结束。这是数理统计学蓬勃发展达到成熟的时期。许多重要的基本观点和方法都是在这个时期被提出来的,且数理统计学的主要分支学科都是在这个时期建立和发展起来的。这个时期的成就包含了至今仍在广泛使用的大多数统计方法。在其发展中,以英国统计学家、生物学家费希尔为代表的英国学派起了主导作用。大工业的发展对产品质量检验问题提出了新的要求,即只抽取少量产品作为样本就对全部产品的质量好坏做出推断。因为如果大批量产品要做全面的检验,既费时、费钱,又费人力,加之有些产品质量的检验要做破坏性检验,全部检验是不可能的。1908 年,英国的威廉·戈塞特(W.S.Gosset)提出了小样本t统计量,利用t统计量就可以从大量产品中只抽取很少量的样本完成对全部产品质量的检验和推断,这样就使统计学进入了现代统计学(主要是推断统计学)的新阶段。费希尔给出了F统计量、极大似然估计、方差分析等方法和思想,J.奈曼(Jerzy Neyman)和E.S.皮尔逊(E.S.Pearson)提出了置信区间估计和假设检验,亚伯拉室·沃尔德(A.Wald)提出了序贯抽样和统计决策函数等,到20世纪中叶,现代统计学的基本框架已形成。

第三时期:第二次世界大战后至今。在这一时期,数理统计学在应用和理论两方面继续获得很大的进展。自20世纪50年代以来,统计理论、方法和应用进入了一个全面发展的新阶段。一方面,数理统计学受计算机科学、信息论、混沌理论、人工智能等现代科学技术的影响,新的研究领域层出不穷,如多元统计分析、现代时间序列分析、贝叶斯统计、非参数统计、线性统计模型、探索性数据分析、数据挖掘等。另一方面,数理统计方法的应用领域不断扩展,几乎所有的科学研究都离不开统计方法。因为不论是自然科学、工程技术、农学、医学、军事科学,还是社会科学,都离不开数据,要对数据进行研究和分析就必然用到数理统计方法,连纯文科领域的法律、历史、语言、新闻等学科都越来越重视对统计数据的分析,国外的人文与社会学科普遍开设数理统计学的课程,因而可以说数理统计方法与数学、哲学一样已经逐渐成为所有学科的基础了。