基于人工智能算法的眼底图像分割方法

二、基于人工智能算法的眼底图像分割方法

随着机器学习算法的日新月异,基于机器学习算法改良的人工智能眼底图像分割方法成为研究的主流。基于人工智能算法的眼底图像分割方法具有较高的敏感性、特异性和鲁棒性,若眼底图像出现病变区域视网膜血管出血以及棉絮斑等显示不佳的情况,这种较高的鲁棒性可以使得经过图像分割后的组织也能够清晰地显示出来。目前,基于人工智能算法的眼底图像分割方法大致可以分为有监督和无监督两类。

(一)无监督眼底图像分割方法

无监督眼底图像分割方法直接从未标记的数据中得到待分割组织特征从而构建分割模型。这类方法主要利用拓扑结构信息及像素之间的邻近关系来进行前景和背景的分离。常用的有基于半径的聚类算法、K均值聚类算法、图搜索元启发式算法等。然而,由于无监督算法是靠算法本身探究数据的特征和规律,因此此类算法的敏感性高,但准确性和特异性相对较低。因此,无监督眼底图像分割方法应用相对较少。

(二)有监督眼底图像分割方法

有监督眼底图像分割方法通过输入眼底图像及其对应分割标签训练分割模型,将每个像素标记为前景或背景。在训练阶段,模型学习训练数据的特征以不断调优参数,输出相应的全局最优或局部最优分割模型。由于最终输出分割模型是由真实标签训练而来的,因此它们通常能保持较好的泛化性能,在不同的数据集上取得更好的分割结果。有监督眼底图像分割方法一般分为传统机器学习和深度学习两类,传统机器学习包括K近邻、支持向量机、神经网络、高斯混合模型、AdaBoost、条件随机场等,深度学习则通常采用近年发展起来的卷积神经网络(CNN)方法,二者的区别见图6-1。

1.基于传统机器学习的有监督眼底图像分割方法

基于传统机器学习的有监督眼底图像分割可分为以下四步。首先,将眼底图像进行一定的预处理,如降低噪声、增强对比度、消除伪影和改善亮度信息等。其次,设计特征提取器,如多尺寸匹配滤波器、Hessian矩阵、灰度共生矩阵等,使算法能够定量分析目标的轮廓、纹理、颜色等特征信息,并获取图像的感兴趣区域和特征参数。再次,将相关特征进行转化,再利用单个或组合分类器根据特征提取器获取的特征先验信息,将图像分割为不同的组成部分。最后,使用合理的后处理算法去除异常点,提高算法整体的准确率。虽然基于传统机器学习算法分割的结果精度较高,但会出现假阳性高、分割结果相比金标准分割过粗的现象,同时存在病理信息、黄斑和视盘周围误分割或过分割等问题。尽管如此,传统机器学习算法依然是现在人工智能和医学领域研究的热潮。

图6-1 两类有监督眼底图像分割方法流程

基于传统机器学习算法会高度依赖于提取的特征类型,这些特征信息可能代表一种特定的数据集,但不代表其他的数据集,因此输出的分割模型往往泛化性能不强、可移植性差。此外,人工手动设计目标特征提取器是一项烦琐的任务,需要大量的时间和专业知识。为了弥补这一缺陷,深度学习算法应运而生。基于深度学习的有监督眼底图像分割方法近年来普及性较强、范围较广,相比于基于传统机器学习的眼底图像分割方法基本可以忽略后处理算法,有效降低前期人工手动设计目标特征提取器带来的人工干预过多的现象。

2.基于深度学习的有监督眼底图像分割方法

基于深度学习的有监督眼底图像分割方法主要包括三步。首先,将眼底图像进行一定的预处理,降低噪声、增强对比度、消除伪影和改善亮度信息等。其次,使用数据增强方法扩充训练数据集,以此增强训练后模型的泛化性能和分割精度。最后,将扩充后的训练数据集输入如卷积神经网络的深度学习网络,利用网络提取待分割组织的多层次结构,随后输入分类器中进行进一步训练,并得到最终的分割结果。

基于深度学习的有监督眼底图像分割方法是一种数据驱动的算法,该算法需要从带有大量标注的训练数据集中学习数据之间的规律信息,确定分割模型的参数。相比传统机器学习算法,无须人工手动设计目标特征提取,即可有效地自动挖掘分割目标的特征和精细信息。基于深度学习的有监督眼底图像分割方法不仅能有效解决预处理和后处理等烦琐的步骤,而且采用的大量训练数据可以加强模型的泛化性能,提高模型的可移植性。

目前,常用的应用于眼底分割的深度学习网络有U-Net、FCN、GAN、ResNet等。