一、发展历史
世界卫生组织2019年10月发布的统计数据显示,全世界有超过4.18亿人患有青光眼、糖尿病视网膜病变、年龄相关性黄斑变性或其他可导致失明的眼病。眼底彩照是由单目照相机在2D平面上捕获的眼底投影。并且与光学相干断层扫描图像和血管造影图像等其他扫描成像方式不同,眼底彩照可以以非侵入性的和经济有效的方式获得,更适合大规模筛查。在眼底彩照中可以直观地观察到许多重要的生物标志物,如视盘、视杯、黄斑、视网膜中央凹、眼底血管以及其他一些与糖尿病视网膜病变相关的病灶(如微动脉瘤、出血和渗出等)。因此眼底彩照可以用于诊断多种眼部疾病,眼部的定期筛查也有助于眼部疾病的早期诊断和及时干预治疗。由于具有专业眼图像分析能力的眼科医生数量相对较少,而需要阅读的眼图像的数量较多,因而对有限的临床资源造成了极大的压力。并且考虑到人工阅读大量眼图像会受到疲劳和主观因素的影响,不同医生的诊断结果可能不一致,从而导致眼疾病的误诊率升高。因此,为了在提升眼疾病诊断准确性的同时减轻医生的诊断负担,眼底彩照的计算机辅助诊断技术越发受到人们的关注。
对眼底彩照的分析研究可以追溯到1973年Matsui等发表的《眼底照片的自动定量诊断研究:在彩色眼底照片上检测视网膜血管图像的轮廓线》,这是世界上首个将数学形态学方法应用于视网膜眼底图像的分析研究。对医学图像计算机辅助诊断技术的大规模系统性研究和开发最早开始于20世纪80年代早期,1984年Baudoin等在发表的《自动检测糖尿病荧光血管造影中的微血管瘤》一文中提出了检测糖尿病视网膜病变损伤的图像分析方法。眼图像处理技术的提升大大推动了眼疾病自动诊断系统的发展,计算机辅助诊断系统使大规模的疾病筛查成为可能,在有效节约资源的同时,大大减轻了医生的诊断负担。21世纪初,随着成像技术和信息技术的不断发展,机器学习领域涌现的各类经典算法被应用于眼底彩照的智能诊断。传统基于机器学习的眼底彩照智能诊断算法通常分为数据获取、数据预处理、图像的特征选择和提取、决策规则和分类器设计等主要步骤。如Ege等于2000年提出了一个基于贝叶斯、马哈拉诺比斯和K邻近分类算法开发的眼底彩照自动分析软件。Cheng等提出了基于超像素分类的视杯和视盘分割方法,用于青光眼的筛查,提取直方图和中心周边统计学特征并用于视盘分割,在视杯分割时在特征空间加入位置信息以提升分割效果。目前传统的计算机辅助诊断方法大多通过人工选取特征,这个过程很大程度上依赖于人工经验,而且在不同的病理条件下,眼疾病在图像上的特征表现多种多样,人工选取的特征并不能适用于所有图像,这极大地限制了计算机辅助诊断方法的使用范围。因此,越来越多的研究者尝试用深度学习的方法自动提取适用于疾病诊断的图像特征以提升眼图像处理和分析的性能。
计算机视觉是深度学习的主要研究领域之一,经过训练后,计算机可以对一幅图像形形色色的特征进行提取和检测,从而准确地分辨图形。数字眼底图像可以用来观察和诊断许多种眼底疾病,常见的有糖尿病视网膜病变、青光眼和高度近视等。通过计算机自动获取和检测眼底图像中视盘的大小与形状、黄斑区域、血管形态、渗出物状况等病灶特征,可以快速有效地帮助医生分析和诊断各种疾病。计算机视觉与图像处理技术被广泛应用于医疗诊断领域,其中针对各类眼底疾病的自动诊断系统在过去20年中取得了很大的进展,已经开发针对糖尿病视网膜病变、青光眼、白内障等眼底病变的自动诊断系统。大多数的工作集中在使用简单的CNN进行彩色眼底图像的分析,主要应用在眼底结构的分割、视网膜损伤的分割和检测、眼疾病的诊断和图像质量评价。在2015年Kaggle组织的糖尿病视网膜病变检测竞赛中,661支参赛队伍中大多数使用了深度学习的方法,其中取得超出人类水平性能的4支队伍都采用了端到端的CNN。Gulshan等对Google Inception-V3网络在糖尿病视网膜病变检测方面的性能做了全面的分析评估,结果显示该网络的性能与7名专业眼科医生的水平相当。此外,谷歌公司正在开发一款深度学习算法,这种人工智能技术可以查看视网膜图像,像专家一样识别眼疾病的共同特征,并帮助发现糖尿病患者视网膜病变的迹象。由此可见,深度学习的方法在眼底彩照智能诊断领域具有广阔的应用前景。