理论教育 数据量胜出:决定胜负的秘诀

数据量胜出:决定胜负的秘诀

时间:2023-06-28 理论教育 版权反馈
【摘要】:在机器学习中,谁拥有最多的数据,谁就是赢家,显然Facebook所拥有的关于人们点赞、好友和照片的数据让其他人只能望其项背。高科技行业中几乎所有拥有大数据的公司都采用了深度学习技术,这一趋势正在以更快的速度扩散。不过,在巴塞罗那举行的2016 年NIPS 大会上,5400 名与会者中有40% 的人是第一次参加会议。多样性继续成为NIPS大会的标志。

数据量胜出:决定胜负的秘诀

2012 年在太浩湖举行的NIPS 大会上,深度学习领域的研究已经日趋成熟(见图11-3)。在这次大会上,早期的神经网络先驱杰弗里·辛顿和他的学生们发表了一篇论文,文中指出,多层神经网络在识别图像中的对象方面性能非常出色。4这些网络不仅比现有计算机的视觉技术更好,它们甚至已经处于一种完全不同的更高层次中,更加接近人类的表现水准。《纽约时报》刊登了一篇关于深度学习的文章,同时Facebook 宣布与另一位深度学习先驱杨立昆合作成立一个新的人工智能实验室,由后者担任创始实验室主任。

Facebook 首席执行官马克·扎克伯格(Mark Zuckerberg)参与了2012 年的NIPS 深度学习研讨会。当时安保成了令人头痛的问题,但也吸引了更多的与会者,我们不得不分流了一部分人到另外一个播放会场同步视频的房间。在之后的招待会上,我被介绍给了扎克伯格,他问了些关于大脑的问题。他对心智理论特别感兴趣。在心理学中,有一个关于心智如何工作的内隐理论,我们以它为指导来理解他人。我们给朋友发短信时,并没有意识到在打字时大脑做出的许多决定。扎克伯格问了很多问题。“我的大脑如何构建我自己的心理模型?”“我的大脑如何根据经验来创建其他人的心理模型?”“我的大脑如何预测其他人的未来行为?”“其他物种有没有心智理论?”我最近在索尔克研究所合作组织了一个关于心智理论的研讨会,扎克伯格想要研讨会上所有的参考资料。

图11-3 在太浩湖赌场举办的2012 NIPS 大会是深度学习领域的一个转折点,让“神经”重新回归了“神经信息处理系统”。图片来源:NIPS 基金会。

在机器学习中,谁拥有最多的数据,谁就是赢家,显然Facebook所拥有的关于人们点赞、好友和照片的数据让其他人只能望其项背。利用所有这些数据,Facebook 可以创建我们的心智理论,并用它来预测我们的偏好和政治倾向,甚至有一天可能会比我们更了解我们自己。Facebook 有朝一日会成为奥威尔小说中老大哥的化身吗?5 你会觉得这是一个令人不寒而栗的前景,还是发现有一个能满足你需求的数字管家很方便?我们可能会问Facebook 是否应该拥有这种权力,但在这个问题上我们也许并没有多少发言权。(www.daowen.com)

尽管我们在太浩湖的赌场举办了2012 年和2013 年的NIPS 大会,但与会者都避开了赌桌。他们知道赌场庄家获胜的可能性更大,更何况,他们正在做的事情比赌博更令人兴奋。赌博会让人上瘾,那是因为多巴胺奖励预测误差系统是我们大脑的一部分(在第10章中讨论过)。赌场已经优化了有利于博彩的条件:获得巨大回报的允诺;随机间隔的偶然小胜(奖励)—— 研究已经证明,这是保持实验室老鼠不停按下食物按钮的最佳方式;在老虎机上获胜时触发的声音和灯光;全天昏暗的灯光,将由光线驱动的昼夜节律与正常的日夜更替分开,怂恿你下注。不过从长远来看,庄家显然赢得更多。

在蒙特利尔召开的2015 年NIPS 大会上,3800 名国际与会者拥入了蒙特利尔会议中心。会议开场时的深度学习课程环节非常受欢迎,导致人满为患。出于防火安全方面的考虑,我们不得不遣散了一些人。高科技行业中几乎所有拥有大数据的公司都采用了深度学习技术,这一趋势正在以更快的速度扩散。在巴塞罗那举行的2016 年NIPS 大会开始前两周,我们将与会人数限制在5400 名。一个从纽约飞来的人很失望地发现他无法在现场注册。2017 年在长滩举行的NIPS 大会在注册开放12 天后就限制注册了,与会者达到了8000 人。如果自2014 年以来,每年出席会议的人数按50% 的增速持续下去,那么最终地球上的每个人都会想参加NIPS 大会。当然,泡沫最终会破裂,但是与大多数泡沫一样,没有人知道这事儿什么时候会发生。

来自科学和工程部门的许多研究人员继续聚集在NIPS 大会上,30 年来年年如此。不过,在巴塞罗那举行的2016 年NIPS 大会上,5400 名与会者中有40% 的人是第一次参加会议。在2016 年之前,NIPS 基金董事会都明智地决定让会议保持在单一会场举行,这对于大型会议来说很少见。其背后的初衷,是让每个人都能坐在同一个房间里,防止场地分散化。但在2016 年,单一会场变成了双会场,因为很难再找到足够大的房间装下所有人。尽管如此,这也远远少于大多数其他大型会议中常见的10个会场。NIPS的文章接受率一直保持在20%左右,低于大多数期刊的接受率。NIPS 在2016 年举办了“机器学习中的女性”(Women in Machine Learning,简称WiML)会议,6为巴塞罗那带来近600 名女性与会者(占与会者总人数的10%),有1000名女性参加了2017 年在长滩举行的会议。多样性继续成为NIPS大会的标志。没有任何一个领域能够独立汇集创造了深度学习的多样化人才。

也许让人感到意外的是,虽然具备了影响如此多行业的潜力,保护深度学习知识产权专利却很少。在20 世纪80 年代,我们希望能让学习算法成为一个新的科学领域的基础,同时认为获得专利对此起不到什么积极的作用。毫无疑问,现在很多公司已经为深度学习的特殊应用提交了专利,因为公司不会在没有保护的情况下对新技术进行大规模投资

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈