反向传播算法及其在多层网络学习中的高效应用

更新时间：2026-01-13 理论教育 版权反馈

【摘要】：加州大学圣迭戈分校成立于1960 年，现已发展成为生物医学研究的主要中心。20 世纪80 年代的数字计算机每秒只能执行100 万次操作。当使用玻尔兹曼机可以训练多层网络的秘密被公开后，许多新的学习算法如雨后春笋般不断涌现。在杰弗里·辛顿和我研究玻尔兹曼机的同时，大卫·鲁姆哈特开发了另一种多层网络学习算法，而后来的实践证明，这种算法的效率更高。

加州大学圣迭戈分校成立于1960 年，现已发展成为生物医学研究的主要中心。它在1986 年成立了世界上第一个认知科学系。1大卫·鲁姆哈特（见图8-1）在那时已经是一位杰出的数学家和认知心理学家，他曾在以符号学和规则为基础的传统人工智能领域工作过，这类研究在20 世纪70 年代的人工智能研究中占主导地位。1979年，我在加州大学圣迭戈分校由杰弗里·辛顿组织的研讨会上第一次见到了大卫，当时他开创了一种新的探索人类心理的方法，他和詹姆斯·麦克莱兰称之为“并行分布式处理”（以下简称PDP）。大卫总是能对问题进行深入思考，并经常提出富有洞察力的评论。

玻尔兹曼机学习算法可以学习如何解决需要隐藏单元的问题，这表明，训练多层网络并突破感知器的限制是可行的，而这种观点与马文·明斯基和西摩尔·帕普特以及该领域大多数人的观点相左。网络中的层数或任一给定层内的连接性都不存在任何限制。但是有一个问题：达到平衡和收集统计数据来进行模拟的速度变得越来越慢，大型网络需要花费更长的时间才能达到平衡。

(https://www.daowen.com)

图8-1　1986 年左右在加州大学圣迭戈分校的大卫·鲁姆哈特，那时他刚出版了两卷《并行分布式处理》（Parallel Distributed Processing）。鲁姆哈特在多层网络模型学习算法的技术开发领域有很大的影响力，并用该技术来帮助我们理解语言和思维心理。图片来源：大卫·鲁姆哈特。

原则上，可以构建具有大规模并行体系结构的计算机，该计算机比具有每次只进行一次更新的传统冯·诺依曼体系结构的计算机快得多。20 世纪80 年代的数字计算机每秒只能执行100 万次操作。今天的计算机每秒能够执行数十亿次操作，并且通过将数千个内核连接在一起实现的高性能计算机，其速度比以前快上百万倍——技术性能得到了空前的提高。“曼哈顿计划”是美国在无法保证原子弹能够研制成功的情况下做出的260 亿美元的赌注（以2016 年的美元价值计算），最大的秘密就是它的确有成功的苗头。当使用玻尔兹曼机可以训练多层网络的秘密被公开后，许多新的学习算法如雨后春笋般不断涌现。在杰弗里·辛顿和我研究玻尔兹曼机的同时，大卫·鲁姆哈特开发了另一种多层网络学习算法，而后来的实践证明，这种算法的效率更高。2

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈

反向传播算法及其在多层网络学习中的高效应用

多层网络的BP算法研究成果

光束传播理论及其在成像雷达中的应用

蚁群算法在应用中的综述

梯度下降及其在神经网络中的应用

智能传播中的算法转向

数据分类算法及其在大数据分析中的应用

数据域和任务定义及其在迁移学习中的应用

不同类型的智慧及其在人类学习活动中的应用

相关推荐