高质量标注数据集缺乏

一、高质量标注数据集缺乏

如前所述,深度学习是数据驱动的。自然图像处理领域有很多大规模的数据集。例如,Image Net拥有超过1 400万张图片。然而,与其他医学领域一样,眼底图像数据集十分有限。与自然图像不同,眼底图像的标注需要专家来完成,难度很大。例如,由于缺乏深度信息,专家通常需要8分钟来标注眼底图像以进行OD/OC分割和青光眼诊断,这些限制导致缺乏高质量标注的眼底图像。而数据集越小,就越有可能导致准确率较低和过拟合。