糖尿病视网膜病变人工智能的应用研究
糖尿病视网膜病变的人工智能算法在实际应用时可以分为糖尿病视网膜病变的诊断/分级和病灶区域的检测/分割两个大方向。其中,糖尿病视网膜病变的诊断/分级是图像分类任务,相关病灶区域的检测/分割则是像素级别的检测任务。考虑到两个方向之间的内在相关性,在进行糖尿病视网膜病变诊断分级的同时还生成病变区域的注意力热图。
(一)糖尿病视网膜病变的筛查与自动分级
糖尿病视网膜病变的诊断一般分为两个步骤:第一步,从筛查的角度出发,选择出应该转诊的患者。轻度非增生性糖尿病视网膜病变(1级)一般不会引起视觉功能障碍,不需要转诊和进一步处理。对需要转诊的2级及2级以上的糖尿病视网膜病变进行筛查,是当前糖尿病视网膜病变人工智能算法的研究重点。第二步,对筛查出的需要转诊的糖尿病视网膜病变患者,根据病变进行进一步细分和分级,区分出病变的严重程度,以便于指导临床。糖尿病视网膜病变的筛查和自动分级是可以循序进行的,因此一些算法或产品在报告筛查效果的同时也会进一步评价不同等级病变的分级效果。
在糖尿病视网膜病变的相关研究领域,美国EyePACS筛查项目现场采集的眼底彩照数据集EyePACS是全球最大最权威的公开数据集之一。EyePACS数据集共有88 702张(包括35 126张用于训练,53 576张用于测试)眼底彩照,用于评价对糖尿病患者人群的筛查效果。Google公司的Gulshan等建立的糖尿病视网膜病变人工智能诊断系统,将127 175张经过眼科专家标注的眼底彩照作为训练集,训练基于深度学习的卷积神经网络算法模型。该系统在EyePACS的9 963张上进行验证,在采用高敏感性的截断值以尽可能发现患者(即避免漏诊)时,达到了97.5%和93.4%的敏感性和特异性,而在采用高特异性的截断值以尽可能避免误诊时,达到了90.3%和98.1%的敏感性和特异性。Gargeya等也使用卷积神经网络模型进行糖尿病视网膜病变的分类,他们使用包含5个残差模块的卷积神经网络来提取图像特征,将被提取的特征和元数据信息共同输入至决策树模型中进行分类。不同于多数研究中区分需要转诊的糖尿病视网膜病变,Gargeya等尝试对筛查后的不需要转诊的糖尿病视网膜病变进行进一步的细分,即分成无病变和轻度糖尿病视网膜病变。2016年David等提出了名为IDx-DR X2.1的糖尿病视网膜病变智能检查系统,该系统为输入的每张眼底彩照都应用一组基于卷积神经网络的检测器,卷积神经网络的结构是基于Alex Net和VGGNet改进的。该系统可以自动预测4类标签,即阴性(无病变或轻度糖尿病视网膜病变)、可参考的糖尿病视网膜病变、威胁视力的糖尿病视网膜病变和低检查质量图像。2017年Krause等使用卷积神经网络对糖尿病视网膜病变进行5级分类,他们使用Inception-V4作为主干网络,在训练期间使用更大的数据集及更高分辨率的输入图像,他们的网络结构是10个子网络集成而来的。类似地,2019年Zhang等建立了一个高质量的带有标注的数据集,并采用集成策略进行有无病变的二分类和病变严重程度的四分类。从不同的卷积神经网络模型中提取的特征通过相应的SDNN模块。这些模块被定义为分量分类器。然后,这些特征被融合并馈送到全连接层以生成最终结果。
(二)糖尿病视网膜病变病灶区域的检测与分割
病灶区域的检测是通过检测图像中是否存在某些病理特征,给医生提供相应的诊断依据。而病灶区域的分割是为了满足定量测量的需求(如病变的形状和体积),在指定的眼底彩照上精确定位出病变并勾勒出病变的解剖结构,主要用于对眼底彩照上的特征性生物学标志进行自动定量测量。近年来,有许多研究致力于糖尿病视网膜病变中病灶区域的自动检测与分割。按患病程度的不同,糖尿病视网膜病变患者的眼底彩照中通常可能存在微动脉瘤、出血、硬性渗出和软性渗出几种病理特征。由于微动脉瘤和出血通常是糖尿病视网膜病变的早期异常表现,对它们的检测对于糖尿病视网膜病变的早期发现和治疗至关重要。由于微动脉瘤具有相似的圆形形状和有限的尺寸范围,因此对微动脉瘤的检测方法主要包括形态学操作和图像滤波。另一些研究将微动脉瘤和出血的检测相结合,比如Esmaeili等提出一种基于曲波变换的算法,在重构的视网膜眼底图像上分离出属于微动脉瘤、出血和血管的候选像素集合,然后基于曲波变换删除所有血管像素,留下的部分即为微动脉瘤和出血的检测结果。渗出物可以分为硬渗出物和软渗出物两类,是糖尿病视网膜病变的另一种关键的病理特征,对它们的准确检测同样具有重要意义。如Franklin等提出了一种利用图像处理技术的算法对糖尿病视网膜病变中的渗出物进行检测,并在公开数据集DIARETDB1上进行试验,获得了很高的精度。此外,还有一些方法针对糖尿病视网膜病变中的多种病灶同时进行检测。Sinthanayothi等提出的一种算法可以同时检测四种病灶特征,然而该方法将四种病灶分为两组:红色病变(包括微动脉瘤和出血)和亮斑缺损(包括硬渗出物和软渗出物),具有一定的局限性。与之相比,高玮玮等提出的算法使用免散瞳眼底图像对糖尿病视网膜病变进行自动筛查,包含视盘的提取及定位和微动脉瘤、出血、硬性渗出及软性渗出的自动检测,在已有数据集上获得了很高的准确率。
(三)糖尿病视网膜病变分析中的注意力机制与注意力热图
考虑到糖尿病视网膜病变的诊断与出血、渗出物和其他病变的检测之间的内在相关性,许多工作在进行糖尿病视网膜病变诊断分级时,在网络模型中加入注意力机制模块,以强调眼底彩照中某些区域对疾病诊断的重要性,并且生成病灶区域的注意力热图。
注意力机制可以理解为让神经网络模型看向哪里。注意力机制可以将原始图片中的空间信息变换到另一个空间中并保留关键信息,在很多现有的方法中被广泛使用。在糖尿病视网膜病变的诊断和分级中,注意力机制负责找出眼底彩照中需要被关注的区域,增强信息量最大的特征,使得后期处理时充分利用这些特征并减弱无用的特征。如2018年Lin等提出了一种基于抗噪声检测和注意力的融合框架,可以进行五级糖尿病视网膜病变分级。他们首先使用卷积神经网络提取特征,然后将特征输入到设计好的中心样本检测器,以生成病变图。再将病变图和原始图像输入到所提出的注意力融合网络(AFN),该网络可以学习原始图像和病变图的权重以减少不必要信息的影响。
卷积神经网络输出的特征映射其实和原图存在一定的空间对应关系。把最后一层卷积层输出的特征映射处理后绘制到原图上,就得到了注意力热图(也就是网络模型更关注的区域)。如Yang等于2017年提出了一种两阶段的深度卷积神经网络,可以同时勾勒出病变和进行糖尿病视网膜病变的严重程度分级。第一阶段是局部网络,提取病变的局部特征;第二阶段是用于糖尿病视网膜病变分级的全局网络。首先从局部网络和原始的眼底彩照获得加权病变图,然后在进行糖尿病视网膜病变分级时,引入不平衡加权方案以更加关注病变区域。