眼底疾病诊断算法发展历史
过去由于医疗技术的限制,眼底疾病的诊断往往依赖医生自身的经验和技术。医生靠自己对宏观指标进行研究并做出判断,这样的效率肯定是不高的。这些年来,随着人工智能的发展,众多学者对人工智能诊断系统进行了深度研究,并取得了很多成果。
对眼底彩照的分析研究可以追溯到1973年Matsui等发表的《眼底照片的自动定量诊断研究:在彩色眼底照片上检测视网膜血管图像的轮廓线》,这是世界上首个将数学形态学方法应用于视网膜眼底图像的分析研究。对于医学图像计算机辅助诊断技术的大规模系统性研究和开发最早开始于20世纪80年代早期,1984年Baudoin等在发表的《自动检测糖尿病荧光血管造影中的微血管瘤》一文中提出了检测糖尿病视网膜病变损伤的图像分析方法。眼科图像处理技术的提升大大推动了眼疾病自动诊断系统的发展,计算机辅助诊断系统使大规模的疾病筛查成为可能,在有效节约资源的同时,大大减轻了医生的诊断负担。21世纪初,随着成像技术和信息技术的不断发展,机器学习领域涌现的各类经典算法被应用于眼底彩照的智能诊断。传统基于机器学习的眼底彩照智能诊断算法通常分为数据获取、数据预处理、图像的特征选择和提取、决策规则和分类器设计等几个主要步骤。如Ege等于2000年提出了一个基于贝叶斯、马哈拉诺比斯和K邻近分类算法开发的眼底彩照自动分析软件。Cheng等提出了基于超像素分类的视杯和视盘分割方法并将其用于青光眼的筛查,提取直方图和中心周边统计学特征并用于视盘分割,在视杯分割时在特征空间加入位置信息以提升分割效果。目前传统的计算机辅助诊断方法大多通过人工选取特征,这个过程很大程度上依赖于人工经验,而且在不同的病理条件下,眼疾病在图像上的特征表现多种多样,仅依靠人工选取的特征并不能适用于所有图像,这极大地限制了计算机辅助诊断技术的使用范围。因此,越来越多的研究者尝试用深度学习的方法自动提取适用于疾病诊断的图像特征以提升图像处理和分析的性能。
计算机视觉是深度学习的主要研究领域之一,经过训练后,计算机可以对一幅图像形形色色的特征进行提取和检测,从而准确地分辨图形。数字眼底图像可以用来观察和诊断许多种眼底疾病,常见的有糖尿病视网膜病变、青光眼和高度近视等。通过计算机自动获取和检测眼底图像中视盘的大小与形状、黄斑区域、血管形态、渗出物状况等病灶特征,可以快速有效地帮助医生分析和诊断各种疾病。计算机视觉与图像处理技术被广泛应用于医疗诊断领域,其中针对各类眼底疾病的自动诊断系统在过去二十年中取得了很大的进展。在眼科领域,人工智能算法已经被应用于糖尿病视网膜病变、视网膜静脉阻塞、青光眼等疾病的眼底彩照处理。卷积神经网络(CNN)的提出更加速了人工智能的发展。Y.Guo等建立的MED net神经网络系统可以自动检测OCT图像中的血管图像。S.K.Devalla等使用ReLay Net神经网络系统自动识别分析OCT图像中的黄斑区各层及视网膜下液。2016年,世界首例使用眼内手术机器人的眼内手术由英国John Radcliffe医院的Robert Mac Laren教授完成,他通过触屏膜和操纵杆操作机器人剥除了患者Bill Beaver右眼黄斑部厚度仅0.01 mm的视网膜前膜。朱江兵等利用计算机视觉算法建立了检测DR特征的自动识别系统。J.Anitha、CKS Vijila等用Kohonen神经网络对400多张异常视网膜图像进行预处理和特征提取并进行高精度的自动分类。2017年,中山大学中山眼科中心刘奕教授等成功建立了能识别先天性白内障的深度学习模型。由于视网膜静脉阻塞的发病概率没有糖尿病视网膜病变高,所以人们对其的关注相对而言就比较少,通过机器学习对糖尿病视网膜病变进行诊断的相关技术研究已经日趋成熟,而有关视网膜静脉阻塞诊断的研究却比较少。随着经济全球化的不断发展,人工智能与医疗决策的关系越来越密切,它在眼科领域也表现出了优势,所以现在它经常被应用于视网膜疾病的诊断当中。近几年来,中国政府提出健康中国行动,使得“人工智能+医疗”的发展迅速被提上日程,2017-2019年,人工智能(AI)连续三次被写进政府工作报告中,由此可见,中国政府对人工智能在医学上的应用越来越重视,这将对其未来的发展起着重要的作用。
基于人工智能的DR分类方法能够通过大量的数据集进行训练从而学习到眼底图像的特征,具有很好的泛化能力,能够有效地提高分类器的分类性能。2017年,Wang等提出Zoom-in-net的深度卷积神经网络,并利用深层网络的特征信息寻找可能的病灶区域,然后在原图中分割这些区域,再送入网络训练,进行DR等级分类,得到了较好的分类结果。Ardiyanto Igi等提出了一种适合小型嵌入式板的紧凑型深度学习算法,它能够很好地检测出DR症状的存在。2018年,Mansour等采用了一种多级优化措施,包括预处理、基于自适应学习的高斯混合模型(GMM)的概念区域分割、基于关联成分分析的兴趣区域(ROI)定位、基于Alexnet DNN的高维特征提取等,提高了系统的分类性能。李琼等采用更为复杂的神经网络模型BNnet,极大提高了准确率,具有较好的鲁棒性和泛化性。2019年,Keel等采用自适应可视化技术对图片进行预处理,结果表明,这种可视化技术可以突出传统的疾病诊断区域,促进了模型的临床应用。杨松霖等通过集成多种模型,提高了模型分类的准确率。
在多病种分类方面,2011年,Mark等采取动态训练策略,也就是在训练的不同阶段,分别从数据集中随机选取不同的样本进行反向传播,将样本反馈到卷积神经网络并进行训练,从而对眼底图像是否存在出血进行判断。2015年,Rocha等则利用深层卷积神经网络来对图像进行分析,对每个像素进行分类,识别是否有微动脉瘤,从而进行分类。2016年,Jaafar先对训练集中的部分图像进行训练,然后利用卷积神经网络对图像中的每个像素进行预测,再对像素进行分类,从而得出视网膜疾病的分类结果。2020年,汤加利用ResNet网络对近视性黄斑病变的病灶进行分类,准确率达到了93.7%。同年,李珊珊对Res Net网络进行了改进,并对年龄相关性黄斑病变进行分类,准确率更是达到了97.7%。