5.3.2 模型参数输入

5.3.2 模型参数输入

在架构PSWE模型中存在许多参数,其超参数的确定直接影响模型的泛化能力、学习能力和快速收敛性能,主要的影响超参数是学习速率δ,批尺寸Batch Size及Dropout rate,其他大量模型内权重参数均是在模型自学习与自调试的优化过程中自动得到的。本书中使用了10-fold cross validation去训练与测试模型,此方法为绝大多数模型训练的默认方式,并未专门说明。另外,为防止过拟合的发生,模型的每层隐层均添加了dropout算法,通过随机阻断部分神经元之间的连接来提升模型的泛化性。模型利用试算估计的方法,结合实测的数据进行初步估算,将土壤水盐含量及夏玉米生产效益实测值与模拟值拟合进行粗调,逐步缩小参数取值范围,然后根据目标损失函数(Huber Loss函数)的最终精度,对率定参数进行微调,使得土壤水盐含量及夏玉米生产效益模拟值与实测值最接近。模型调试后最终学习速率δ=0.03,Batch Size=32。

模型其他输入参数:模型模拟0~100 cm土壤水盐运移,每20 cm为一层,共分5层;模拟时间为夏玉米整个生育期,从5月10日—9月27日,共计140 d,时间步长为1 d;单次灌溉量在60~135 mm,全生育期灌溉3次,初始步长为5 mm,最小步长为1 mm,最大步长为10 mm(模型输入的灌溉时间点按照当地灌溉时间确定,其余时间点灌溉量均为0);其他气象参数均按照当天平均值输入;并根据模型计算的结果精度调整输入参数的步长。