4.3.2 竞争自适应性重采样
竞争性自适应重加权采样法(Competitive Adapative Reweighted Sampling,CARS)(LI H, et al.,2009)源自达尔文的“适者生存”的进化理论,被用于选择光谱中的最能代表原始光谱特征的波长组合。CARS通过交叉验证选择N个变量子集,确定最低均方差值的子集,在每个单独的采样中,应用蒙特卡洛模型采样、指数递减函数、自适应再加权采样和最低均方差值来减少波长,以实现最优选择。CARS优化算法中,每一次根据响应式权重计算取样(Adapative Reweighted Sampling,ARS)保存PLS模型中回归系数平方根权重值比较大的点作为新的子集,除掉权值比较小的点,随后根据一个新的子集创建PLS模型,经过长时间的测算,挑选PLS模型互动认证均方根误差(RMSECV)最小子集里的波长作为特点波长(许童羽等,2022)。CARS算法的具体过程如下。
采用蒙特卡洛采样法,每一次任意从校准集中化挑选一定数量(一般为80%)的样板进到建模集,剩下的20%作为预测分析集创建PLS实体模型,蒙特卡洛的采样频次(N)要提前设置(路皓翔等,2021)。纪录每一次采样全过程PLS实体模型里的回归系数的绝对值权重值,|bi|为第i个变量的回归系数绝对值,wi为第i个变量的回归系数绝对值权重,m为每次采样中剩余的变量数。
利用指数衰减函数(Exponentially Decreasing Function,EDF)强行去除回归系数绝对值权重相对较小的波长(王翠秀等,2019)。在第i次基于MC采样建立PLS模型时,根据EDF得到保留的波长点的比例Ri为
式中 μ,k—— 常数,可以按照以下两种情况计算。
在一次采样并进行相应计算时,所有的波长都参与了建模分析,因此此时保留的波长点的比例为1。在最后一次采样在(第N次)完成并进行相应计算时,只剩下两个波长参与PLS建模,此时保留的波长点的比例为2/n,其中n是原始波长点数。由以上最初及最后一次采样的情况可知,μ和k的计算公式为
在每次采样时,都从上一次采样时的变量数中采用自适应加权采样(ARS)选择数量为Ri*n个的波长变量,进行PLS建模,计算RMSECV。
在N次采样完毕之后,CARS优化算法获得了N组备选的特点波长子集,及其相对应的RMSECV值,挑选RMSECV极小值对应的波长自变量子集为主要特征波长(王翠秀等,2019)。
竞争自适应重加权优化算法(CARS)是由自适应重加权采样(ARS)技术选择出PLS实体模型中相关系数平方根大一点的波长点,除掉权重值小一点波长点,利用互动认证挑选出RMSECV指最低子集,能够有效寻出最佳自变量组成。