实验结果及分析

五、实验结果及分析

本节主要是在基准数据集上对所提出的AMCSNN网络与同架构的CNN和CSNN从网络的识别准确率和训练耗时两个方面来进行实验对比分析,验证所提出的AMCSNN网络的有效性。

1.实验平台及数据集

实验平台的软硬件信息如下:主频2.20GHZ的4核CPU,32GB的RAM,显存16GB,GPU为英伟达GeForce Titan Xp,64位Ubuntu Linux 16.04的操作系统,Anaconda3.6,CUDA10.0,Python3.6.5,Pytorch1.2。本节在MNIST数据集、Caltech(FACE/MOTORBIKE)数据集以及面向图像集的ETH-80数据集上对AMCSNN进行了实验分析。MNIST数据集是验证SNN网络有效性的首选数据集。本章选取了Caltech101数据集中的人脸与摩托车2类物体进行实验,组成Caltech(FACE/MOTORBIKE)数据集,并针对数据集图像大小不一的问题,统一数据集图片大小为160×250。ETH-80数据集的样本是由某一物体在不同光照、遮挡、视角等情况下的图像集所组成的数据集,含有8类不同物体,包括苹果、汽车、杯子等物体,其中每类有10个图像集,每个类别图像集中含41张图片。图4-4展示了随机选择的实验数据集的部分图片。

图4-4 实验所用数据集的部分图片

图4-5(a)(b)(c)依次为MNIST、Caltech(FACE/MOTORBIKE)以及ETH-80数据集的部分实验图片。

2.参数设置

本章提出的网络模型采用分层训练的方法,在整个网络的训练中,只有卷积层需要通过学习来更新权重,特征提取与分类是完全分离的,网络的详细参数见表4-1。实验中对每个卷积层均做了500次的权重更新。

表4-1 网络参数设置

表4-1中,因STDP为网络的学习规则,而网络学习主要发生在卷积层,故其参数学习率在卷积层给出。脉冲发放的总时间步长为15,MNIST数据集为10类,Caltech(FACE/MOTORBIKE)数据集为2类,ETH-80数据集为8类,故SVM的输出为10/2/8,—表示无此项参数,SVM的惩罚参数为2.4。

3.实验结果分析

(1)识别准确率分析。因为SNN尚未有高效的学习算法,其在图像识别任务中的准确率较差。但本章所提的AMCSNN,融合了卷积与脉冲网络,同时,引入了轻量级的注意力机制,提升了网络的识别准确率,通过实验,得到了堪比CNN的识别效果。本章提出的AMCSNN,通过与同架构的CNN和卷积脉冲神经网络CSNN在三个不同图像数据集上的识别准确率对比如图4-5所示。

图4-5 三个网络模型在三个图像数据集上的识别准确率

从图4-5可以看到,本章提出的AMCSNN在三个图像数据集上的表现均实现了良好的识别效果,在三个数据集上AMCSNN网络的识别准确率分别达到了98.42%、99.3%和84.14%。可以看到,CSNN相比于出色的CNN网络,模型的识别准确率显著降低,为了解决该问题,引入了注意力机制,网络识别准确率明显提高,AMCSNN与CSNN相比,在三个数据集上的识别准确率分别提升了2.01%、0.48%和3.35%。AMCSNN与同架构的CNN网络在三个数据集上的识别准确率仅相差0.24%、0.22%和0.01%,识别效果堪比CNN。从数据集的复杂程度来看,在复杂的ETH-80数据集上网络的识别准确率提升最高,这也说明了数据集越复杂,网络模型的识别准确率提升越明显,而对于简单数据集,网络很容易达到拟合,取得较好的识别效果。

此外,图4-6可视化了AMCSNN在MNIST数据集上的混淆矩阵。可以看到,AMCSNN除了对类别“3”和“8”的识别类准确率在97%以外,其他8种类别的识别准确率均在98%以上,特别是对类别“1”和“4”以及“6”的识别准确率均达到了99%以上,这充分表明了AMCSNN网络具有良好的识别效果。

图4-6 AMCSNN在MNIST数据集上的混淆矩阵

图4-7展示了AMCSNN和CSNN在Caltech(FACE/MOTORBIKE)数据集上的ROC曲线。根据ROC曲线特性,从图4-7可以看到,加入注意力机制的AMCSNN的网络识别效果要优于未加的CSNN。这也再次说明了引入的注意力机制,对网络模型识别准确率的提升具有一定的贡献。

(2)网络训练耗时分析。SNN与CNN等传统人工神经网络相比,其优势在于基于脉冲的稀疏事件,网络中的脉冲神经元只有收到来自突触前神经元的脉冲时,才会进行计算,这与基于模拟值的传统网络相比,计算量更少,网络计算得更快。因此,除了从网络的识别准确率来分析之外,本章还从网络的训练耗时来对网络的计算性能进行实验与分析。一般来说,网络模型的计算效率越高,训练耗时就越少。图4-8对三个数据集上的三个网络模型的训练耗时进行了对比。

图4-7 AMCSNN与CSNN在Caltech(FACE/MOTORBIKE)上的ROC曲线

图4-8 三个网络模型在三个图像数据集上的训练时长

从图4-8可以看到,本节提出的AMCSNN网络在三个图像数据集上的训练耗时均最少,取得了较好的效果。对于三个数据集,从CNN到CSNN再到AMCSNN,网络的训练时间在逐渐减少,特别是从CNN到CSNN,网络的训练时间显著减少,这也说明了基于脉冲的网络计算量更少,计算效率更高,网络计算更快。同时可以看到,对于同一网络,数据集越大,网络的训练时间越久。结合图4-6的网络识别准确率可知,对于同一数据集,网络的识别准确率越高,网络训练耗费时间越长。而对于AMCSNN网络来说,网络的识别准确率堪比同架构的CNN网络,但AMCSNN网络的训练耗费时间却远远少于同架构的CNN网络。通过上述实验结果对比,可以看到,本章所提出的AMCSNN网络不仅具有较强的生物合理性优势,而且识别准确率堪比CNN网络,同时具有较少的网络训练时间,这充分表明了AMCSNN网络的有效性。

本节受视觉系统的分级信息处理机制与视觉系统的脉冲信息表示和传递机制的启发,结合了卷积神经网络与脉冲神经网络的优势,设计并实现了混合卷积脉冲神经网络,并针对网络模型识别准确率低的问题,加入注意力机制,提出了基于注意力机制的卷积脉冲神经网络模型。之后在三个数据集上对所提出的脉冲神经网络从识别准确率和网络训练耗时两个方面进行了实验,并与同架构的卷积神经网络和混合卷积脉冲神经网络模型进行了对比分析,验证了所提出的脉冲神经网络模型的有效性。