眼底多病种分类网络
2025年08月10日
一、眼底多病种分类网络
我们使用Efficient Net网络作为分类器。它于2019年由谷歌提出,具有一种对分类网络优化更加泛化的思想。过去的分类网络优化方式通常是在增加网络深度、增加网络宽度和增加分辨率中采用一种,而Efficient Net的作者认为这三种方式不应独立存在,因此作者提出了一种复合模型缩放方法,通过同时优化网络深度、宽度和分辨率来提升性能,在取得SOTA准确率的同时,大大减少了模型参数量和计算量。图7-27展示了模型在各种维度的缩放方式。
图7-27 模型在各种维度的缩放方式
Efficient Net的作者通过实验表明单维缩放方式可以有限地提升网络性能,达到一定瓶颈后性能不再有提升。作为对比,作者使用图7-27e方式进行模型优化,手动设置3个维度的模型缩放参数,实验表明复合扩展方式取得比任一单维度扩展更好的结果,表明复合扩展能够进一步优化网络的性能。
Efficient Net的核心模块为移动翻转瓶颈卷积(MBConv)模块,该模块借用了2017年最后一届ILSVRC竞赛获得冠军的SE-Net的注意力思想,通过压缩与激发操作,生成具有全局感受野的1×1卷积层来为特征通道赋予权值。图7-28是扩展6倍、卷积核5×5、步长为2的MBConv图例。
Efficient Net共有8个版本,区别是输入大小和3个维度的缩放参数有所不同,由于硬件限制,我们选择参数量最小的Efficient Net-B0作为分类网络。Efficient Net-B0的结构为:16个MBConv模块、2个卷积层、1个全局池化层及最后的全连接分类层。完整结构见图7-29。
图7-28 MBConv结构示意图
图7-29 EfficientNet-B0结构