眼底图像质量评估分类模型的介绍
对于眼疾病自动筛查系统而言,可接受的眼底图像需要达到眼疾病诊断的标准。以DR自动诊断系统为例,图像中对正确诊断至关重要的部分必须是清晰可见的,例如血管和病变区域。从人类视觉注意机制的角度来看,人类更加关心视网膜的前景区域,忽略含有信息较少的背景区域。几种经典的CNN(Alex Net、Goog LeNet、VGG、Res Net-50和Inception-ResNet-V2)介绍如下。
(1)Alex Net:在2012年ImageNet大规模自然图像识别挑战赛(ILSVRC)中凭借很大的优势获得冠军。其网络复杂度相对较低,是在图像分类任务中最常用的网络之一。
(2)Goog LeNet:使用Inception模块来创建具有22层的深度网络,与此同时,它具有比其他网络(如VGG和Alex Net)少得多的参数。Inception结构具有多尺度性,可以学习到图像中不同尺度的特征。
(3)VGG:VGG网络具有较好的性能,在很多任务中都有着极其出色的表现。VGG16只在卷积层中使用3×3滤波器,减少了参数的数量。VGG19在VGG16网络的基础上增加了卷积层的数量,其特征提取的性能相对于VGG16更优,但其网络的参数量和计算量也更大。
(4)ResNet-50:ResNet是2015年ILSVRC的赢家,错误率为3.6%,它提出了残差学习框架,每个残差单元结构由一个残差块和一个捷径连接组成,以简化网络的训练,避免了网络过深导致的梯度弥散。这种结构可以搭建50层、101层、152层甚至更深的网络。ResNet-50有6个模块,分别称为conv1、conv2x、conv3x、conv4x、conv5x和全连接层。其中conv1是卷积层,conv2x、conv3x、conv4x和conv5x分别由3个、4个、6个、3个残差块组成。
(5)Inception-Res Net-V2:Inception-Res Net-V2为2016年提出的模型,使用了新的Inception-Res Net模块,该模块融合了Inception结构的多尺度性和残差结构的优点,避免了网络过深导致的梯度弥散。Inception-ResNet-V2使用小卷积核替换大卷积核,相比于Inception-V4具有更小的计算量。