计算机、人工智能和未来产业的发展

计算机、人工智能和未来产业的发展

今天要我讲的题目非常大:计算机、人工智能和未来产业的发展。我讲不了。今天我不可能仔细讲什么是计算机科学与工程。如果要我讲,至少可以讲三年半。我今天准备给大家简要介绍的内容大致是:首先,讨论一下什么是人工智能,然后花一点时间看一些应用;其次,分享一些信息,告诉大家现在大咖们认为人工智能的产业有多大,或有多小;再次,介绍一下南科大在这一方面是怎么布局的,这个布局包括教学、研究方向。这和大家的切身利益关系比较密切;最后,简单说说人工智能发展的趋势会在哪些方面。

一、什么是人工智能

这个问题,仁者见仁,智者见智,在学术界还没有一个统一的人工智能定义。那你说能不能给出一个大概的描述,描述非常多,我这里抽出三个略微典型的描述。最早的描述,是1956年开达特茅斯会议的时候讲的人工智能。那时描述人工智能的关键字是智能行为,就是说非常强调行动和行为。我们再看第二种描述,是斯坦福大学Nilson(尼尔森)教授对人工智能的描述。他说人工智能一定跟知识有关系。就是怎么表达知识、怎么获取知识、怎么使用知识、怎么产生新的知识。第三种描述就更有意思了,是麻省理工学院Winston(温斯顿)提出的,就是一个计算机系统能做过去只有人才能做的事,这就叫人工智能。

我希望看到的人工智能系统是什么呢?首先,我希望这个系统能像人一样会思考,也就是说,能做推理类比,就是从一些旧的知识能推出新的知识。这一点现在的计算机是做得不好的,希望我们将来能够做到。其次,希望计算机能听懂一个声音,能看懂一幅图像,还能像人一样行动。这里“懂”字是关键。我给你看一幅图像,我说看到没有,你说看到了。看懂了没有?你可能会犹豫一下,说看懂了,或者说没看懂。看到和看懂不一样,听到和听懂也不一样。现在智能搜索、机器学习、语音识别、机器翻译等,似乎有一点点像“懂”,但不是真正的“懂”。

人工智能,实际上它是一门技术科学,大家要是把人工智能只理解为应用的话,就有偏差。那这个学科里面包括什么?它有理论、方法学,一套技术,还有它的一些应用的系统。虽然应用系统我们看得比较多,但是应用系统必须建立在坚实的理论基础和方法学上面。

二、人工智能三大分支

下面讲讲人工智能都有哪些分支。我这里给大家讲3个分支。要真正讲细的话不是3个分支了,30个分支都出来了。

第一个分支也是最古老的分支,就是智能搜索。

智能搜索就是现在假如处在某一个状态,这个状态可以是一张地图上的状态,或者下棋的时候棋盘当前的状态等。这叫初始状态A。那我脑子里还有一个终结状态B,比如下棋时的终结状态,应该是我赢的状态,而不是对方赢的状态。智能搜索就是怎样能在最短的时间内从我的初始状态找到我希望的终结状态。这里面有一个很重要的计算机科学的根本问题,那就是对找到最终解的效率极其重视。我们感兴趣的是如何在尽可能短的时间内找到一个最优解。

第二个分支就是推理,在人工智能里面发挥着非常大的作用。

现在大家都说知识就是力量。你说知识是力量吗?是还是不是?你为什么说知识是力量?

学生1:因为有了知识我们可以创造无限的可能。

姚新:好,因为有知识可以创造无限的可能。所以说知识就是力量的时候,是因为这个知识可以让你产生出新的知识。所以你有的知识或许能给你一些力量,但是只有在你能产生新知识的时候,才具有真正的力量。所以推理非常重要。

计算机自动推理就是研究怎么设计出一些理论、方法和技术,只要我们给定一些已知的知识给计算机系统,它就能自动生成一些我们以前不知道的新知识。这跟古老的逻辑有关系,这个逻辑包括非常简单的三段论。这也是为什么我们南科大一定会开一些逻辑课。推理是一个非常有前景,而且非常重要的人工智能分支。

推理有两种最重要的方式,一个叫演绎推理,一个叫归纳推理。这两种推理方式大家在中学和大学学过,并且是一辈子都在学,一辈子都在用。人工智能领域现在用归纳推理的非常多。举个例子,大家都用手机,手机能识别你的指纹、头像和声音,归根到底全靠归纳推理。是它看了很多的例子,然后推断出来的。归纳推理跟演绎推理有一个本质的不同,就是当前机器学习中归纳推理出来的结论不是真正证明出来的,不一定都正确,这就是为什么所有的图像识别系统都会犯错误。归纳出来的结果一定是跟它看的样本点密切相关的,如果你从出生到现在看到所有人都是戴眼镜的话,你可能会认为人类是必须戴眼镜的。你信不信?

第三个分支就是机器学习。

现在绝大部分的机器学习方法,大家接触到的都是基于归纳推理。我这里讲三种非常经典的学习方法。

第一种就是有监督学习。比方说我现在给你一个样本,或者一个例子。这个例子有输入输出,例如用人脸来识别性别,我会告诉大家这个人脸是代表男性,那个人脸代表女性。然后计算机根据这种带标号的数据学习。

第二种机器学习方法叫作无监督学习。就是数据只有输入没有输出。那你说这学什么东西啊?这个好像不太好理解,只有输入没有输出能学什么东西?无监督学习不是学输入和输出之间的关系,而是学数据之间的相似性关系。

第三种比较常见的方法就是强化学习。强化学习就是学习的过程不断会有反馈信息,但是学习的正确答案不清楚。就像我给大家布置作业,然后你做完作业以后我告诉你,这个作业做得挺好,比另一个学生做得好。但是我并不把正确答案告诉你,所以这就有点像增强学习。如果每次都给你正确的答案,就变成了监督学习。

三、人工智能应用

第一个例子就是图片搜索,都不需要输入关键词就能搜索。无论是百度还是其他的搜索引擎,你还可以用声音做搜索,这个在以前是很难做到的。

另外一个跟人的生存有很大关系的应用,就是人工智能在医疗和健康辅助设备方面的应用。科技发展的初始阶段往往是把人类从一些烦琐的体力劳动中解放出来。脏活、累活人都不愿意干,但是计算机科学发展到一定程度以后,你猜一猜它将来会把哪些人解放出来?真正能解放出来的往往是在所谓的职业分工两端。大家看新闻的时候都知道,在西方社会比较好的职业是医生和律师。但是大家再仔细想一想医生和律师工作的特点是什么?医生看病过程,既没有证明也没有推断,他凭什么?他凭的是科学和经验。经验性的东西本质是在做归纳推理。医生看了好多的个体,依据前面看的200个病人症状跟你差不多,都是感冒,所以你也是感冒。这是他的推理。我想这种推理人类应该做不过计算机,为什么?你看200个例子,计算机就能看2000个,而且还不要工资,还不累,还不会跟病人吵架。所以,看病的时候,真正用机器看病,比用人眼看和分析有可能要好得多。

大家再去想想律师一天到晚在做什么?

学生2:咨询。

姚新:律师做咨询,他咨询凭什么?他看的法律书比你多,他将法典一本一本地记在脑子里。所以这是他的一个强项。他的第二个强项,他看的案例比你多。这两件事律师也做不过计算机。所以说医生和律师受到人工智能的威胁更大一点,其他职业受到的威胁还小一点。

还有一个应用是垃圾自动分拣。我刚才说了,重活、脏活、危险的活可以用机器去替代。垃圾分拣不是一件容易的事情。大家可以想象一下,假如垃圾堆里面有塑料、罐头、纸,你怎么分拣啊?人很容易分辨,但靠机器就不太容易。

我不知道大家有没有想说,以后我造一个人工老师,我不要姚老师你在这里。我自己设计一个我喜欢看的老师,然后天天站在那里给我讲。可不可以?

学生3:看网课。

姚新:看网课,所以你说将来这种机器人可以给大家上网课,好主意。我有一些问题,但是我这里就不详细讨论,我只给大家提示两点:一是你可不可以做得到?二是如果做到了,你愿不愿意去上这个网课?想想这两个问题,非常有用。

我还想说说自动驾驶。我们计算机系有一个智能交通中心,专门做自动驾驶的。所以大家有时间可以去看一下。若发现有的车走得特别小心,走得比你还慢的话,那可能是一个刚刚学步的自动驾驶车。

交通风险的预测实际上不是一件特别容易的事情。因交通事故而去世的人,每年都有很多,已成为一个大问题。如果在座的同学能把这个问题解决,不但是对中国有贡献,而且是对全世界都有贡献。这个问题之所以难,是因为这个问题不是一个固定环境下的静态问题,而是一个动态环境下不断变化的问题。因为整个过程都在变。你在解决问题的过程中你都不知道哪些在变化,必须有一些智能的应对方法。这就是为什么现在计算机科学和人工智能都非常强调自适应性和自学习。

智能零售已经有商店了。但我个人不太信任它的门禁的安全性,要是进去了出不来就是一件尴尬的事情。大家对计算机科学感兴趣的话,应该也学一学计算机安全和计算机隐私。大家如果真正对计算机科学感兴趣,或者对人工智能感兴趣,千万不要认为这是一个纯技术学科,一定跟人文是有很大的关系的。为什么呢?因为用计算机科学发明出来的技术,最终还是要给人用。

四、人工智能产业发展问题

我从网站上搜集到一些有关人工智能产业的信息,大家说说,看看能不能读出我想给大家传递的信息。

2016年的一个网页,讲中国人工智能产业规模及预测,它说2016年会突破100亿元,2017年将提高50%,达到150亿元。它说到2019年大概有344亿元。这个网页到了2017年说根据相关报告指出,2017年中国人工智能核心产业规模超过了700亿元,预计到2020年大概是1600亿元。

大家读出来什么没有?没读出来?不会吧。你们上课时老师肯定会告诉你们怎么读这些信息啊,要把这个字面的东西读进去。读出了什么东西?同一个网页两年的内容,其字面后有一个很重要的信息——真正的产业发展是比人的预想要快得多,也大得多的。2016年的时候它说2017年大概能到150亿元,其实2017年的时候是700亿元。是预测不靠谱吗?不是预测不靠谱,而是这些产业的发展已经超出了预测范围。

下面我给大家介绍一下国内两个公司,一个是百度,一个是阿里。然后我稍微提一下它背后用的技术是什么东西。

百度的搜索、游戏等应用,背后最根本的技术十有八九是深度神经网络。所有这些应用根本的特征都是搜集信息、建模和判断。信息可以是图像,可以是生物信息,然后做出判定。深度神经网络算法,不但现在可以做二维视觉和图像,还可以从二维扩展到三维,现在可以看到一些三维的图像,不用戴特殊的眼镜,这些已经可以做得到。也可以做三维重建,从二维图像里面生成三维图像。

这些应用,它的技术方法不外乎两种。一种做学习,学习就是用深度学习网络。另一种就是做检索,智能搜索,在千百万幅图像中找到自己最需要的那一幅,判断两幅图像之间的相似性,或者两段视频的相似性。这些应用虽然是五花八门,从字符识别到面部搜索,但其背后的技术一定跟深度学习和图像检索有关。

大家再看阿里系列的应用和技术。它做什么呢?它做字符识别,还有一系列的应用。它做人脸识别,然后做客服机器人。这是阿里已经商业化的应用。这些应用中,识别类的应用比较多,跟图像视觉有关系的比较多。视觉是一个什么功能?是一个感知性的功能。人工智能发展到现在,它对感知类的任务完成的效果比较好。视觉是一个,听觉也是一个。感知除了视觉和听觉还有什么?嗅觉是感知,触觉也是感知。如果你做一个机械手抓一个鸡蛋,十有八九要么掉地上,要么就把它捏破了。为什么?这个触觉反馈系统不是那么好做的。

大家看上述两家公司的应用里面什么东西比较缺,跟知识有关系,跟自动推理有关的,即如何从已有的知识中产生出新知识。现在的人工智能还做不好知识推理。所以大家要是看媒体忽悠你说人工智能怎么神奇的时候,你不要跟着它走。媒体引领的人工智能可能会把你引领到沟里面去。

五、我国将人工智能定位为战略性技术

我仔细学习国家政策后的第一点体会,就是国家对人工智能非常重视。我语文不太好,但是我还是知道有顿号的时候表示顿号前后的东西是一个并列词。并列词的意思就是说它的重要性和规模是类似的。人工智能跟新材料居然能并列到一块去了,人工智能和生物制药也并列到一块去了。由此可见国家对这个领域的重视程度。

我学习后的另一个体会就是人工智能是一个战略性技术。国家认为发展人工智能是一个战略抓手。从学科发展来说,大家可以看国务院的一些规划,教育部也有一些规划。

那么,为什么南科大要办一个智能科学与技术专业呢?因为这是国务院和教育部鼓励大学发展的学科。因为工业界,尤其是大湾区的信息技术产业,对这一学科有很大的需求。

现在简单谈谈海外的情况。有一个海外专家是专攻人工智能和机器学习技术的,我就去听他的报告,了解下他们怎么看人工智能与机器学习技术,看他们认为什么重要,什么要“卡脖子”。神经网络和深度学习被列为第一,不准出口,不跟你讲,你们自己弄去。第二个是进化和遗传算法,有出口管制,你们自己弄去吧。第三个是强化学习,等等。大家听完以后有什么感觉?真有意思。

六、南科大计算机科学和人工智能方面的资源及未来的主攻方向

在我们学校,大家可以利用的资源是什么?

第一个资源是早在2017年的时候,咱们学校就成立了人工智能研究院。2017年我们建立了深圳市计算智能重点实验室。所以大家将来到三年级要进实验室的时候,这是一个可以利用的资源。到了2018年,我们又成立了“南科大智能交通中心”,大家感兴趣也可以去看看。2019年成立了“广东省高校演化智能系统重点实验室”。可见学校对人工智能非常重视。

有同学也许会说,姚老师,我才刚读一年级,你给我讲研究是不是远了点?不远呀,到9月份我们会招新的智能科学与技术的本科生。所以大家将来三年级选专业的时候,这个应该是可选的专业之一。但是我有一个观点想强调一下,无论你学什么专业(包括人工智能),计算机科学一定是基础。

现代科技的发展,计算机科学与技术是根本。任何一个现代的科学研究领域都离不开计算机科学与技术。大家信不信?你做材料我不让你有计算机,你做得了材料吗?你根本做不了材料,你连一个方程组都解不出来,你还做什么材料呢?材料的特性常用一大堆的微分方程来描述,许多微分方程是没有解析解的,只能用数字解。同理,你做生物,做制药,都需要建计算模型,通过计算模型分析预测把什么东西和什么东西兑到一块,然后再去做实验。所以计算机科学和人工智能技术真正成了其他科学技术的一个基本的支撑。

真正要学好人工智能应该瞄准什么地方呢?我的体会是数据非常重要。没有数据,当前的人工智能什么都做不了,现在的人工智能应用非常依赖数据。另外还依赖什么呢?还依赖巨大的算力。

这种依靠大数据大算力的做法一定不是人脑的做法。大家识别猫和狗,你看过100万只猫的照片吗?没有,你才看两次就知道了。所以说,虽然现在人工智能系统做得似乎很好,但也许有不同的途径做出这样的系统,可能会一样好。

我一再强调有的算法是处理静态的问题,有的算法是处理动态的问题。处理动态问题的话就棘手多了,动态分为确定性和不确定性两种。没有不确定性的是可预测的,但是不确定性是不可以预测的,不好建模。所以很多研究算法的人真正想解决的问题是,在一个动态不确定性环境下,怎么找出最合适的答案,不见得是最佳的答案。所以,假如将来大家进入计算机科学专业或人工智能专业,一定是把所学的课程围绕三个方面进行思考:数据、算力、算法。

我最后再强调一下,做技术的,还是应该关心人文方面的事情。五六年前我读过一篇文章,海外有一位教授做了一个实验,他把芯片植入老鼠的大脑里面,然后搞了一个遥控器,控制老鼠在迷宫里面怎么走。是不是还蛮有意思的?活着的老鼠。你说姚老师讲这个故事干什么,我摸不着头脑。大家回去想一想,这如果纯粹从做研究上来说是挺有意思的。问题是,如果真的这么无控制地做下去它会是什么样子?这个芯片如果不是植到老鼠的大脑里面,而是其他生物大脑内,这事可能就有点问题了。

提问与回应

学生1:教授您好,我想问一下如果摆脱现阶段科学发展的局限性,您认为人工智能产业发展的天花板在哪?就是您眼中它未来能到达一个什么高度?

姚新:你是说这个产业发展的大小还是从应用领域来说?

学生1:从应用领域来说。

姚新:我觉得应用领域里面现在是最有前景的,能看到、感知到的如听说读写的一些东西。听说读写里面理解性的东西现在是做不了的。从研究的角度来说,一定是往理解和推理这个方向发展。因为这一方面的需求比较多,但是现在做得不好。

学生2:老师,有没有想过哪一天给人也植入芯片,通过芯片来进行人组网,比如说社会学哲学问题等。

姚新:这个问题问得非常好。有两方面,一方面是现在芯片有植入人脑的,但是我看到的所有的这种应用都是医学方面的应用。比如说有大脑疾病的人,或者是对一些肢体瘫痪的人。但第二个方面你讲的这个,我从来没有想过。因为是通过植入芯片扩展人的智力,然后通过群体的方式解决一些个体解决不了的问题。这个我不知道怎么做或者是该怎么做。所以说这是一个很好的问题。如果你对这方面研究感兴趣的话,一定要注意,所有跟人打交道的实验要特别小心,涉及伦理问题。

学生3:刚才您PPT里面有一页提到了启发式算法和元启发式算法,二者有什么区别呢?

姚新:启发式算法通常针对不同问题要设计不同的启发式信息。但元启发式算法通常具有很好的通用性,同一算法可用于不同的问题。

学生4:老师,如果作为通识课来学,新生想要学两门计算机课,除了java之外还有什么课会比较好?

姚新:这个问题非常好。作为通识课的话,学java和学计算机导论应该可以的。

学生5:教授您好,我一直在想一个问题,就是像一些大专的学生,如果只学技术的话,他们也能够熟练地使用编程。作为我们学校的学生,如果想学计算机类的课程,我们应该掌握的知识,和他们应有什么区别呢?

姚新:这个问题问得是好得不能再好了。

计算机科学实际上有一个特点,你在大学学到的知识在大学毕业的时候有些已经过时了。4年前学的语言和一些工具现在可能不适用了。那你会说这不是很亏啊,我上技校出来写代码好像写得更快。其实大学里面你学的一定是学知其然和知其所以然。以程序设计作为一个工具来说,在技校里面你学习用java怎么写程序,好比我告诉你这是一个扳手,你就学怎么用这个扳手,但是他可能不会讲这个扳手设计的原理,那在计算机科学系我们一定要讲这个原理。这些原理是跟着你一辈子的,这是真正区别一个人上没上过大学的地方。

学生6:姚老师,我是一个材料系的研究生,我们本科的时候有一句话“条条大路通CS(Computer Science,计算机科学)”。我想问的是,像我们这些非CS的理工科研究生,应该从什么角度切入这一波AI的浪潮比较合适,非常期望听到您的意见。

姚新:条条大路通CS,这话蛮有意思。很多做计算机科学的本科专业并不是计算机科学。比如有些学物理出身的人做计算机做得很好,实际上这跟思维方式有关。

回到你的问题,我觉得切入可以有不同的层次啊。假如说你要真想慢慢了解人工智能这个领域或者计算机科学领域,你可以从应用开始做起。你做材料的可能跟物理有点关系,你可能做模型的能力比较强,从这里可以入手。如果你做演绎的能力比较强,就去做推理,你可以从那里起步啊。如果真要转到计算机专业来的话,我觉得可以以问题为导向,通过解决问题来有针对性地学习。这比你从什么CS 1、CS 2这些课程开始肯定要好。