第9章 聚类分析与判别分析
2025年09月26日
第9章 聚类分析与判别分析
“物以类聚,人以群分”,科学研究在揭示对象特点及其相互作用的过程中,不惜花费时间和精力进行对象分类,以揭示其中相同和不相同的特征。聚类是将数据分到不同的类的一个过程,同一类中的对象具有很大的相似性,而不同类的对象具有很大的相异性。从统计学的观点看,聚类分析是通过数据建模简化数据的一种方法。在分类的过程中,人们不必事先给出一个分类的标准,聚类分析能够从样本数据出发,自动进行分类。聚类分析所使用方法的不同,常常会得到不同的结论。不同研究者对于同一组数据进行聚类分析,所得到的聚类数未必一致。判别分析也是一个分类的过程,例如在医疗实践中,要根据患者的各种体验指标(如体温、血压、脉搏、白细胞等)判别患者是否是该种疾病。判别分析是按照一定的判别准则,计算判别指标,从而确定某一样本属于哪一类。
虽然判别分析和聚类分析都是研究有关对象的分类问题,但是它们的出发点和结果是不一样的。聚类分析是在不知道类型的个数和结构的前提下工作,把相似性最大的样本分到一类。而判别分析已经对类有基本的了解,根据判别准则,对样本的归属做出判别。实际实验的时候,可以先通过聚类分析以得知分类,然后再根据分类进行判别。下面将分别介绍聚类分析与判别分析。