眼底图像质量分析的系统框架

二、眼底图像质量分析的系统框架

眼底图像质量分析的人工智能算法系统框架见图3-6,包括数据集、图像预处理、模型构建、分类结果。输入的数据集包含眼底图像及对应的质量分类标签。原始眼底图像来自不同型号的眼底照相机,图像尺寸不一、分辨率过高,且包含大量背景像素。图像越大导致网络的训练速度越慢,为了在保证不损失原始眼底图像信息的同时提高网络的训练速度,需要对图像进行归一化处理。首先在原始图像中剪裁出包含眼底图像的最小正方形,再缩放至统一尺寸(如512×512)便于CNN进行处理。为了避免训练过程中因为数据不足而出现过拟合现象,需要对训练数据进行扩增,常用的扩增方法有水平翻转、垂直翻转、旋转、缩放等。模型构建的第一步是通过下采样提取图像特征,下采样包含卷积层、池化层、批归一化(batch normalization,BN)层。卷积层负责获取图像局域特征。池化层降低特征图的尺寸并将尺度不变特征传递到下一层。BN层对训练过程中每层的输出进行归一化处理,使数据的分布总是在变化敏感的区域。训练网络时使用预先设置好的参数,如训练轮数、学习率等。训练结束后保存模型,完成模型构建。使用保存的模型就可以对眼底图像进行质量分类并对其进行测试、评估。

图3-6 眼底图像质量分析的人工智能算法系统框架