如何通过学习识别镜像对称？

时间：2023-06-28 理论教育 版权反馈

【摘要】：玻尔兹曼机可以解决，但感知器却不能解决的一个问题，就是如何学习镜像对称。每个10×10的阵列都存在垂直、水平或对角方向上的镜像对称。网络模型的目标是学习如何在没有参与网络模型训练的新样本中依据对称轴进行分类。与玻尔兹曼机的学习过程类似，观察了显示器数日之后，我的视觉系统被训练到可以自动检测对称性，而不需要在屏幕上四处对比查看。

如何通过学习识别镜像对称？

玻尔兹曼机可以解决，但感知器却不能解决的一个问题，就是如何学习镜像对称。17 人体是沿着一个垂直的轴两边对称的。我们可以用这个对称轴生成大量随机图案，如图7-5 所示，也可以采用水平轴和对角轴对称。在我们的玻尔兹曼机网络中，按照10×10 排布的若干块二进制输入被投影到16 个隐藏单元中，然后再投影到3 个输出单元，每个输出单元对应3 个可能的对称轴中的一个。在接受了6000个对称输入模式的训练后，玻尔兹曼机对全新输入的对称轴进行分类的成功率为90%。感知器得到的结果不会比随机猜测的结果好，因为单一的输入并不包含关于模式对称性的信息，必须对输入对之间的相关性进行考察。值得注意的是，人类观察者看到的输入阵列与玻尔兹曼机所看到的并不一致，因为玻尔兹曼机的每个隐藏单元都从整个阵列接收输入，并不遵循任何特定的顺序。对于观察者来说，等价的问题是要随机安排阵列中输入单元的位置，这会使阵列在观察者看来是随机的，即使其中存在隐藏的对称性。

pagenumber_ebook=144,pagenumber_book=124

图7-5　对称的随机图案。每个10×10的阵列都存在垂直、水平或对角方向上的镜像对称。网络模型的目标是学习如何在没有参与网络模型训练的新样本中依据对称轴进行分类。图片来源：T.J.Sejnowski，P.K.Kienker，and G.E.Hinton，“Learning Symmetry Groups with Hidden Units：Beyond the Perceptron，”Physica 22D（1986）：260-275，figure 4。(www.daowen.com)

有一天，我正盯着显示器，以每秒两次的速度读出每个输入模式的对称性。当时我在约翰·霍普金斯大学心理学系的同事尼尔·科恩（Neal Cohen）也在观察这个屏幕，但他却不能区分这些对称性，除非凑近了仔细看，他对我的这项本事感到很惊讶。与玻尔兹曼机的学习过程类似，观察了显示器数日之后，我的视觉系统被训练到可以自动检测对称性，而不需要在屏幕上四处对比查看。尼尔和我设计了一个实验，用本科生作为未经训练的考察对象，观察他们在这一任务上的进展。18 开始时，他们花了很长时间才找出正确的对称性，但经过几天的训练以后，他们的速度变得飞快。到了实验后期，他们能够快速、轻松地找到对称性，甚至可以在任务过程中与我们进行交谈，得到的答案依然准确无误。这是非常快速的感知学习。

我在约翰·霍普金斯大学教授过计算生物物理学，这门课程吸引了很多有才华的学生和研究人员。本·尤哈斯（Ben Yuhas）是与我一起工作的电子工程系的研究生，他在写作博士论文期间，训练了一个神经网络来阅读唇语。19 人的嘴巴在运动过程中包含了声音的信息。尤哈斯的网络将嘴部的图像转换为每个时间点上产生声音的相应频谱。这一技术可以辅助处理有噪声的声谱以改善语音识别。他的研究生同学安德里亚斯·安德里欧（Andreas Andreou）是希腊族塞浦路斯人，他当时正在Barton Hall 大楼的地下室里建造模拟超大规模集成电路芯片（将在第14章中进行介绍）。在20世纪80年代，许多院系的教师对待神经网络的态度都不太友善，这样的现象在很多机构中都非常普遍，但这并不能阻止尤哈斯或安德里欧研究的脚步。事实上，安德里欧后来成了约翰·霍普金斯大学的正教授，并合作建立了约翰·霍普金斯大学语言和语音处理中心。尤哈斯则组建了一个咨询团队，为政府和企业客户提供数据科学咨询服务。

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈

有关深度学习的文章

如何通过学习识别镜像对称？

如何使用镜像功能对图形进行对称复制？

如何操作镜像实体？

如何识别创业机会？

如何检测对称度误差？

如何识别市场机遇？

如何识别缺陷类型？

如何识别轿车的代号？

三维镜像操作：对象镜像创建副本

相关推荐