5.2.2 数据处理流程

5.2.2 数据处理流程

数据集采用数据增强的方法,使用的方法包括随机角度翻转、添加随机噪声、增加亮度和对比度。之后再经过归一化处理、局部裁剪等方法,得到明成化、明嘉靖、明万历、清康熙四个时期的640个验证样本。

具体方法:(1)随机角度翻转:以图像中心为旋转中心旋转15°。

(2)添加随机噪声:对图像分别添加30%的椒盐噪声和高斯噪声。

(3)增加亮度和对比度:调整图像的亮度为原来的 90%和150%。

(4)归一化处理:对数据集图像进行归一化处理是利用深度学习进行图像分类任务时的重要环节,图像归一化是将数据集中的图像在大小和像素值两个方面置于一个共同的统计分布中,实现数据的一致性。经过归一化处理,像素值将调整到(0,1)区间,可以加速模型训练。

(5)局部裁剪:分别以每张图像长和宽的1/1.5处、1/2处、1/2.5处和1/3处为中心进行局部裁剪,裁剪的图像大小为100*100。将裁剪后不包含青花瓷器特征的图像或只包含少量特征的图像删除。通过局部裁剪得到更细致地描述青花瓷器的特征,从而对数据集进行扩充。

最终利用成像光谱数据的空间维构建的图像数据,得到明成化、明嘉靖、明万历、清康熙四个时期的640个验证样本。如图5.6至图5.9展示明成化、明嘉靖、明万历、清康熙四个时期部分样本。

图5.6 明成化青花瓷成像光谱数据空间维成像部分样本展示

图5.7 明嘉靖青花瓷成像光谱数据空间维成像部分样本展示

图5.8 明万历青花瓷成像光谱数据空间维成像部分样本展示

图5.9 清康熙青花瓷成像光谱数据空间维成像部分样本展示