3.3.2 迁移学习

3.3.2 迁移学习

深度学习模型在对输入的数据不断训练中进行完善,使最终得到的模型对于待测试数据具有较高的普适性,深度学习模型的优化程度决定着最后的分类结果的优劣。得到一个优化程度较高的深度学习模型,只能通过训练大量有标注的数据,在能获得大量数据的前提下,标注的数据还是占少数的,标注数据是一项需要耗费大量人力、时间的任务,同时,大数据就需要更强的配套设备,对绝大多数用户来说,专业的配套设备是不具备的。深度学习的目标是构建一个更加具有普适性的模型,通过这个模型能完成各种不同的任务,但这种有强大泛化能力的模型很难实现。可以通过学习某一领域的知识,再迁移到另一个领域,从而达到适用各种不同数据的情况。

随着数据规模和计算资源的快速增长,机器学习在理论和实践两方面都取得了长足进展。传统机器学习方法通常依赖于数据的生成机制不随环境改变这一基本假设。然而在机器学习的各种应用领域中,如大数据分析、自然语言处理、计算机视觉、生物信息学等,上述假设往往因为过于严格而难以成立。如何分析和挖掘非平稳环境中的大规模数据是现代机器学习最具有挑战性的前沿方向之一。迁移学习放宽了传统机器学习中训练数据和测试数据必须服从独立同分布的约束,因而能够在彼此不同但又相互关联的两个领域间挖掘领域不变的本质特征和结构,使得标注数据等有监督信息可以在领域间实现迁移和复用。

迁移学习(Transfer Learning),或称归纳迁移、领域适配,是机器学习中的一个重要研究问题,其目标是将某个领域或任务上学习到的知识或模式应用到不同的但相关的领域或问题中。迁移学习试图实现人通过类比进行学习的能力,例如学习走路的技能可以用来学习跑步,学习识别轿车的经验可以用来识别卡车等。与半监督学习、主动学习等标注数据稀缺解决风险的本质不同在于,迁移学习放宽了训练数据和测试数据服从独立同分布这一假设,从而使得参与学习的领域或任务可以服从不同的边缘概率分布或条件概率分布。迁移学习的主要思想是,从相关的辅助领域中迁移标注数据或知识结构、完成或改进目标领域或任务的学习效果。在很多工程实践中,为每个应用领域收集充分的标注数据代价十分昂贵,甚至是不可能的,因此从辅助领域或任务中迁移现有的知识结构从而完成或改进目标领域任务是十分必要的、是源于实践需求的重要研究问题。可以认为迁移学习是在最小人工监督代价下进行机器学习的一种崭新策略。在自然语言处理、计算机视觉、医疗健康与生物信息学等领域,目标任务的标注数据稀缺、领域分布异构等问题十分突出,迁移学习具有很强的现实需求。

本书主要是利用迁移学习,把模型在大型数据集ImageNet上学习到的图像分类知识成功运用到待解决的新的目标分类任务中,以不同年代景德镇青花瓷的纹饰、款识和造型等作为图像特征标签。迁移学习的优点包括:① 以现有的经典图像分类网络模型作为新搭建模型的基础,通过冻结经典图像分类网络模型的参数层,然后对卷积模型结构局部进行微调,构建本书景德镇青花瓷真彩色图像年代分类模型,并得到最终分类识别结果。② 迁移学习缩短了预训练时限,能显著提高模型分类效率,并提升分类任务质量。迁移学习训练过程如图3.15所示。

图3.15 迁移学习训练过程