理论教育 反向传播算法及其在多层网络学习中的高效应用

反向传播算法及其在多层网络学习中的高效应用

时间:2023-06-28 理论教育 版权反馈
【摘要】:加州大学圣迭戈分校成立于1960 年,现已发展成为生物医学研究的主要中心。20 世纪80 年代的数字计算机每秒只能执行100 万次操作。当使用玻尔兹曼机可以训练多层网络的秘密被公开后,许多新的学习算法如雨后春笋般不断涌现。在杰弗里·辛顿和我研究玻尔兹曼机的同时,大卫·鲁姆哈特开发了另一种多层网络学习算法,而后来的实践证明,这种算法的效率更高。

反向传播算法及其在多层网络学习中的高效应用

加州大学圣迭戈分校成立于1960 年,现已发展成为生物医学研究的主要中心。它在1986 年成立了世界上第一个认知科学系。1大卫·鲁姆哈特(见图8-1)在那时已经是一位杰出的数学家和认知心理学家,他曾在以符号学和规则为基础的传统人工智能领域工作过,这类研究在20 世纪70 年代的人工智能研究中占主导地位。1979年,我在加州大学圣迭戈分校由杰弗里·辛顿组织的研讨会上第一次见到了大卫,当时他开创了一种新的探索人类心理的方法,他和詹姆斯·麦克莱兰称之为“并行分布式处理”(以下简称PDP)。大卫总是能对问题进行深入思考,并经常提出富有洞察力的评论。

玻尔兹曼机学习算法可以学习如何解决需要隐藏单元的问题,这表明,训练多层网络并突破感知器的限制是可行的,而这种观点与马文·明斯基和西摩尔·帕普特以及该领域大多数人的观点相左。网络中的层数或任一给定层内的连接性都不存在任何限制。但是有一个问题:达到平衡和收集统计数据来进行模拟的速度变得越来越慢,大型网络需要花费更长的时间才能达到平衡。

(www.daowen.com)

图8-1 1986 年左右在加州大学圣迭戈分校的大卫·鲁姆哈特,那时他刚出版了两卷《并行分布式处理》(Parallel Distributed Processing)。鲁姆哈特在多层网络模型学习算法的技术开发领域有很大的影响力,并用该技术来帮助我们理解语言和思维心理。图片来源:大卫·鲁姆哈特。

原则上,可以构建具有大规模并行体系结构的计算机,该计算机比具有每次只进行一次更新的传统冯·诺依曼体系结构的计算机快得多。20 世纪80 年代的数字计算机每秒只能执行100 万次操作。今天的计算机每秒能够执行数十亿次操作,并且通过将数千个内核连接在一起实现的高性能计算机,其速度比以前快上百万倍——技术性能得到了空前的提高。“曼哈顿计划”是美国在无法保证原子弹能够研制成功的情况下做出的260 亿美元的赌注(以2016 年的美元价值计算),最大的秘密就是它的确有成功的苗头。当使用玻尔兹曼机可以训练多层网络的秘密被公开后,许多新的学习算法如雨后春笋般不断涌现。在杰弗里·辛顿和我研究玻尔兹曼机的同时,大卫·鲁姆哈特开发了另一种多层网络学习算法,而后来的实践证明,这种算法的效率更高。2

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈