6.3.3 传统学龄人口预测的方法

6.3.3 传统学龄人口预测的方法

目前针对区域内入学人数预测的研究尚少,而入学人数的预测问题是人口预测的一种。本质上,人口预测的目标是预测在某个时间点某个位置的相关指标值,如区域流行病的感染人数、区域犯罪率等。因此,人口预测的相关研究工作可作为学龄人口预测的参考。人口预测领域现有的模型大致可以分为传统的基于数理统计的方法和基于深度学习的预测模型。

现有的人口预测模型大多采用数理统计模型,人口预测问题的主要研究对象是时间序列数据。早期研究主要分为两种:一种是根据经典的人口模型作为参考,并结合不同的预测场景进行优化改进;另一种是采用传统的时间序列预测方法,根据数据的时间维度进行预测,依赖于特征工程和特征选择来获得较好的预测结果。

国外最早对人口问题进行定量研究的是英国人口学家Malthus,在1978年建立了人口指数增长模型Malthus模型[34]。随后,荷兰科学家Verhulst对人口指数增长模型进行了修正,把影响人口增长的社会环境、自然环境等相关因素考虑进去并提出了logistic人口阻滞增长模型[35]。Leslie提出了一个能够综合考虑多个影响因素的预测模型,即著名的Leslie矩阵模型,在人口预测领域得到了广泛的应用[36]。(https://www.daowen.com)

我国针对人口预测的模型研究较晚,国内学者在对国外的研究成果进行扩展后结合我国的实际国情提出了新的模型,包括:宋健在20世纪80年代初将人口出生、死亡、妇女生育率等综合考虑提出的人口发展方程[37];曾毅将我国人口分为农村与城镇两类进行预测研究,进一步提高了人口预测的准确度[38];郝永红等引入传统的时间序列预测模型——灰色模型对人口预测开展了研究,取得了很好的效果[39]。中国人口信息研究中心王广州根据我国的人口特点研发了中国人口预测软件(CPPS),该软件主要使用的方法是分要素人口预测方法,能模拟人口的年龄结构的动态变化趋势和过程,并进行分析。

近年来,我国有不少学者借鉴了人口预测的研究成果而开展了学龄人口的预测研究工作。袁桂林等利用CPPS软件,基于中国2000年人口普查资料,对我国小学、初中、高中、大学四个阶段的学龄人口变动趋势进行分析[40];李玲等同样利用CPPS软件,基于人口普查第六次数据,考虑“全面二孩”政策的影响,对我国2016—2035年义务教育阶段学生规模进行预测[41];赵佳音等基于北京及其各区县2000—2010年人口年龄数据,利用灰色模型对2016—2025年学前至高中阶段的学龄人口进行了预测,并对学龄人口变动趋势与波动幅度进行了分析[42];薛耀锋等采用Leslie人口模型,以全国第六次人口普查数据和2010—2014年的人口历史数据为依据,预测基础教育的学龄人口未来发展趋势,并模拟预测了2016—2025年我国学龄人口的变化趋势[43];周志等针对天津义务教育情况,采用灰色预测模型和线性回归原理,以《中国统计年鉴》《天津市统计年鉴》《天津调查年鉴》的数据对天津市户籍学龄人口的规模进行了预测[44];姚翠友等使用Leslie人口模型,考虑“全面二孩”政策等因素,采用了人口普查第六次数据,对北京市分城乡进行2020—2030年基础教育学龄人口的预测[45]。以上学者针对学龄人口预测普遍采用数理统计方法,如灰色预测、CPPS人口预测、Logistic回归预测以及队列要素法等。但从已有研究表明,采用灰色模型对人口发展趋势做预测,通常只能反映出某个区域内人口的逻辑增长,无法解释一个区域内生育率变化及迁移引发的人口规模变动;CPPS人口预测系统中设定的生育率为全国人口普查的全国维度,不适用于省级预测;Logistic模型只适合在短时期内的、较小区域的预测。虽然近年来通过构建可反映种群、人口生死更替的Leslie矩阵模型,有效解决了上述存在的问题,并在预测过程中显示出较强的稳健性和鲁棒性,但Leslie矩阵模型的基本假定是所分年龄组内的人数稳定,作为人口预测的工具具有很高的效度,但通常情况下分年龄人口数的数据通常很难获取,从而使其很难得到大规模应用。以上统计预测方法拟合函数单一,并且依赖经验支持,导致模型复杂度较低,较难反映时序本身的数据分布规律。