Logistic白化权聚类算法优化方案

更新时间：2026-01-13 理论教育 版权反馈

【摘要】：图5.13函数f3曲线由上述讨论，可建立Logistic白化权函数。图5.15拐点斜率示意图综上讨论可得参数bj应满足下列条件：由Logistic白化权函数所建立的聚类算法称为Logistic白化权聚类算法。

灰色聚类分析作为灰色系统理论的重要组成部分，一直是人们讨论和实际应用较多的灰色技术之一。在传统灰色白化权聚类算法的基础上，很多专家和学者对其进行了改进。

现有的改进算法大多是在三角白化权函数的角度或从权重的角度进行改进，或将传统灰色聚类直接应用到实际问题当中。针对传统白化权函数存在的缺点，本书作者通过引入Logistic（逻辑斯谛曲线）函数，将传统白化权函数进行改进，建立Logistic白化权函数，得到改进的Logistic白化权聚类算法。

通常情况下，灰色白化权聚类算法中的白化值选取只是通过经验定义累积频率曲线百分率来确定，通常不够合理。我们知道，累积频率曲线是单调增的，在类的分界点处的累积频率变化速率相对较慢。由类分界点的性质可得在类的分界点的二阶差分值趋于0，且类分界点左侧的二阶差分小于0及右侧二阶差分大于0。故选取累积频率曲线中拐点为白化值，即类区间临界点。

5.5.2.1　简述Logistic函数性质

Logistic函数是一种常见的S形函数，该函数曲线起初阶段大致是指数增长；然后开始变得饱和，增长的速度变慢；最后，达到成熟时渐进停止增长。它的输入范围是－∞→＋∞，而值域刚好为（0，1），满足概率分布为［0，1］的要求，且是一个单调上升的函数，具有良好的连续性。故本书作者引入Logistic函数，将传统白化权函数进行改进，建立Logistic白化权函数。见图5.10，从而得到改进的白化权聚类方法。

图5.10　Logistic函数曲线

设Logistic函数为

对f（x）求一阶导数，有

对f（x）求二阶导数，有

令f″（x）＝0，得ae－bx－M－1＝0，得

由此可得b越大，在拐点处斜率越大。

由上述对Logistic曲线的推导可得，可以通过调整b的大小来调整白化权函数曲线的形状。

5.5.2.2　Logistic白化权函数的模型建立

（1）Logistic曲线函数：

（2）将f（x）图形以x轴为对称轴进行翻转，得到下面函数：

函数f1（x）的曲线图如图5.11所示。

图5.11　函数f1（x）曲线

（3）将f1（x）图形以y轴为对称轴建立对称曲线，得到下面函数：

函数f2（x）的曲线图如图5.12所示。

图5.12　函数f2（x）曲线

（4）将f2（x）图形向上平移c个单位，并向右平移d个单位，得到下面函数：

函数f3（x）的曲线图如图5.13所示。

图5.13　函数f3（x）曲线

由上述讨论，可建立Logistic白化权函数。设

对fjk（x）求一阶导数，有

对fjk（x）求二阶导数，有

图5.14　Logistic白化权函数拐点示意图

其中

因为即拐点的函数值为不妨设白化权函数fjk右侧拐点与fjk＋1左侧拐点重合，拐点横坐标均为白化值λk（k＝1，2，…，m－1）。由于

fjk＋1（x）曲线右拐点，即第k类中心点的右侧拐点为

这里1≤k≤m－1。(https://www.daowen.com)

fjk＋1（x）曲线左拐点，即第k＋1类中心点的左侧拐点为

这里1≤k≤m－1。由此可得白化权函数fjk中，这里1≤k≤m。

5.5.2.3　聚类算法分类效用分析

分类效用最初是由M.Gluck和J.Corter于1985年提出的“类别好”的量度。它尝试最大化同一类别中的两个对象具有共同属性值的概率，以及来自不同类别的对象具有不同属性值的概率。它是具备给定类别结构知识的观察者给不具备类别结构知识的观察者提供的一种预测增长优势的规范性的信息理论度量。从这一层面考虑，分类度量的动机与决策树学习中使用的信息增益度量相似。分类效用CU被用来评判聚类结果的好坏。CU值较小表明聚类较差，CU值较大表明聚类较好。CU定义为