5.4.2 区域义务教育师资配置聚类实验及结果分析

5.4.2 区域义务 教育师资配置聚类实验及结果分析

1.区域师资配置基础数据

本应用的基础数据为某省17个地市区域师资配置,数据主要包括三大类:教师数量结构、教师质量结构及培训情况。其中,教师数量结构包含:专任教师占比、专任教师与学生比、教职工与学生比;教师质量结构包含:职称占比、学历占比、学科结构人数占比、年龄结构占比;教师培训情况包含:培训级别占比;共计8个指标。由于采集的初始数据为具体的数值数据,不可直接进行对比评价,因此根据已出台的国标或省标,对各指标具体数值进行定量打分;表5-1中打分后的结果可供后续横向评价及综合分析。表5-1所示的为17个地市区域师资数据8个指标的定量打分及加权处理,获得8个指标下的区域教师资源配置现状。综合评价结果一定限度上可以反映在多元指标综合描述下,区域师资的配置情况。

表5-1 某省17个地市师资配置8个指标定量评价

图示

续表

图示

2.基于K-Means及DBSCAN的师资配置综合聚类

对表5-1中8个基础指标构造特征属性集。为对多元指标描述下的区域师资配置情况进行进一步分析,分别利用K-means及DBSCAN算法进行聚类,实现不同区域配置的类别划分,分析不同区域师资配置相似及差异化特点。同一类表示师资配资情况相似,类间表示配置差异。

1)K-Means聚类结果及分析(https://www.daowen.com)

根据最小误差平方和变化斜率最大原则,选取最佳聚类类别数为2,不同k值下的误差平方和曲线如图5-11所示。对17个地市的特征属性集进行K-means聚类,其中市州编号1、2、17被判定为第一类;市州编号3~16被分为第二类。分别选择第2个指标专任教师与学生比和第3个指标教职工与学生比构建二维空间,将聚类结果进行可视化,结果如图5-12所示。从图5-12可以发现,利用表5-1中的8个指标进行师资配置评估,17个地市之间存在明显分级分类情况,被分为同一类的地市师资配置相似,分到不同类别的地市师资配置差异较大。该算法可以较好地完成不同地市的师资配置的类别划分。

2)DBSCAN聚类结果及分析

DBSCAN聚类时参数ε=0.92,MinPts=9,最佳聚类结果为4类。其中,地市编号1为第一类;编号2~9、11、12、14~17为第二类;地市编号10、13分别为第三类及第四类。分别选择第2个指标专任教师与学生比和第3个指标教职工与学生比构建二维空间,将聚类结果进行可视化,结果如图5-13所示。DBSCAN无需设置聚类类别,算法自动根据数据情况,识别离群的噪声以及数据的聚合关系。从聚类结果看,本次17个地市的数据都成功聚类,未被判定为噪声点,表明不同地市之间师资配置存在相似特点以及差异性,且没有明显极端配置情况出现;但是地市编号1、10及13单独成类,表明配置情况与其他地市存在一定的差异。

图示

图5-11 误差平方和曲线

图示

图5-12 K-means师资配置聚类结果

3.师资配置聚类结果分析与评价

基于17个地市师资配置多元指标综合评价及聚类结果发现:

(1)在8个指标依据标准量化的基础上,通过设定权重,可以获得综合师资配置评价结果,反映区域综合配置优劣情况。

图示

图5-13 DBCSAN师资配置聚类结果

(2)基于K-Means及DBSCAN两个算法对17个地市的8个师资指标进行聚类,发现基于K-Means及DBSCAN均可以完成17个地市师资配置的类别划分,且无离群噪声点出现。这说明17个地市师资配置存在明显的区域相似及差异化的特点,处于同一类的地市师资配置情况总体相似;而处于不同类的地市师资配置之间存在差异,且无极端异常配置情况出现。此外从两种算法聚类结果发现:DBSCAN算法根据师资配置差异,将17个地市分为4类;K-Means算法根据误差平方和梯度下降最大原则,将数据分为2类。虽然具体分类结果存在一定的差异,但均能把大部分地市划分到一个类别,进一步表明17个地市的师资配置确实存在明显的相似性;此外,编号为1的地市在两组分类结果中,均未与主流地市分入同一类别,表明该地市的师资配置与其他地市差异比较明显,可进一步关注。

此外在分类过程中,K-Means算法与DBSCAN算法在运行时间上也存在一定的差异,聚类时参数选择对分类结果也有影响。总体而言,DBSCAN算法无需预先剔除噪声点及设置聚类类别个数,自动根据邻域半径及邻域内样本个数阈值,迭代出任意形状的聚类,对具有空间特点的分布有更好的适用性,且噪声点对聚类的影响较小;但数据量较大时迭代会耗费大量内存。而K-Means算法在进行聚类时,无法自动识别离群的噪声点,当存在极端异常师资配置时,可能对迭代次数及聚类结果产生一定的影响,且该算法不能发现非凸形状的数据簇,产生的结果不一定是全局最优,只能保证局部最优。

(3)通过对17个地市师资配置聚类分析,聚类结果可以直观反映区域间师资配置的相似及差异,为后期有针对性地进行师资优化配置提供数据支持。此外,在教育均衡评价及师资配置研究领域,可以考虑纳入更多教育资源数据及更先进的数据分析方法,挖掘其中隐含的知识,为教育行政管理部门制定决策提供一定的数据参考。