中国未来产业目标之首“类脑智能”
近年来,随着大脑成像、脑机交互、生物传感、大数据处理等新技术不断涌现,脑科学与计算技术、人工智能、纳米材料、认知心理等学科的交叉融合,正酝酿着重大理论与技术突破,类脑智能上升为西方发达国家的科技战略重点,大国间博弈日趋激烈。美国、欧盟、日本等相继提出自己的类脑智能计划,类脑智能皆被列为未来产业核心目标。[7]我国已开始在类脑智能、量子信息、基因技术、未来网络、深海空天开发、氢能与储能等前沿科技和产业变革领域,谋划布局一批未来产业,并把类脑智能列为未来产业目标之首,意义重大而深远。
“十四五”规划纲要提出,在类脑智能、未来网络等前沿科技和产业变革领域,前瞻谋划一批未来产业,这是国家面向未来特别是面向2035年远景目标提出的一个重要战略思想。从领域上,重点是在类脑智能、量子信息、基因技术、未来网络、深海空天开发、氢能与储能等前沿科技和产业变革领域,组织实施未来产业孵化与加速计划,谋划布局一批未来产业。
类脑智能是人工智能的最高形态和终极目标,类脑智能具备信息处理机制上类脑、认知行为表现上类人、智能水平上达到或超越人的特点。类脑智能的重要性正如欧盟人脑旗舰研究计划项目所指出的:“在未来10年到20年内,谁要引领世界经济,谁就必须在这个领域领先。”
类脑研究的演变
冯·诺伊曼1945年发布的著名研究报告表明,大脑神经系统是其提出的冯·诺伊曼计算机体系结构的重要参照,在该报告中有诸多文字对比了其体系结构与大脑神经系统的相通之处。在他过世后,后人根据其讲稿整理而成的《计算机与人脑》专著中,更是将计算机和生物人脑进行详细比较,大量借助神经元、突触和连接等神经科学的术语来描述计算机结构,尝试阐述计算机和人脑的等价性,并提出计算机与大脑在本质上都是自动机的观点。艾伦·图灵也早在1948年提出了一个用类神经元作为基本单元组成网络的方式构建计算机的方案。但因为条件所限,冯·诺伊曼与图灵都没有真正实现仿神经的计算系统。
早期的突破来自麦卡洛克(McCulloch)与皮茨(Pitts),他们于1943年首次提出了单个神经元的McCulloch-Pitts计算模型,此模型作为构建人工神经网络的基础单元一直沿用至今。加拿大生理心理学家赫布(Donald Hebb)在1949年提出著名的赫布法则(Hebb’s Law)。神经网络的学习过程发生在神经元之间的突触部位,突触的联结强度会随着突触前后神经元的活动而变化,同时被激发的神经元之间的突触联结会增强。该法则在后来的人工神经网络中得到广泛使用。此后,康奈尔大学罗森布拉特(Frank Rosenblatt)在1958年利用McCulloch-Pitts模型建立了首个神经网络模型“感知机”,成功应用于线性可分的模式识别问题求解,后续还研制了用硬件实现感知机原理的神经计算机,从而开创了模仿大脑神经系统的人工智能联结主义学派。后来,联结主义几经起落,终于在最近十多年以深度学习的方式重新获得巨大发展。
从20世纪70—80年代开始,一些计算机科学家认为,应该采用更接近于生物大脑系统的机制。诺贝尔奖获得者杰拉尔德·埃德尔曼(Gerald Edelman)进行了逼近真实解剖和生理数据的神经系统大规模仿真,并研制了一系列“达尔文”仿脑机。大规模集成电路先驱、加州理工学院卡弗·米德(Carver Mead)教授则从神经元及神经网络的硬件实现的角度出发,开创了“神经拟态计算”(neuromorphic computing)方向,提出用模拟、数字或混合电路模仿更具有生物逼真性的脉冲神经网络,计算功耗低是其重要优点之一。[8]
可以看到,近70多年来,“类脑”概念的内涵与外延在不断演化。在早期,类脑一般是指从软硬件上模拟生物神经系统的结构与信息加工方式。随着软硬件技术的进步,以及神经科学与各种工程技术的多方面融合发展,脑与机的界限被逐步打破。尤其是脑机接口,在计算机与生物脑之间建立了一条直接交流的信息通道,这为实现脑与机的双向交互、协同工作及一体化奠定了基础。随之,“类脑”的概念逐步从信息域自然地延伸到生命域。因此,以脑机互联这一独特方式实现计算或智能,也被归入“类脑研究”范畴。
归纳起来,类脑研究是以“人造超级大脑”为目标,借鉴人脑的信息处理方式,模拟大脑神经系统,构建以数值计算为基础的虚拟超级脑;或通过脑机交互,将计算与生命体融合,构建以虚拟脑与生物脑为物质基础的脑机一体化的超级大脑,最终建立新型的计算结构与智能形态。我们不妨将类脑的英文称为Cybrain(Cybernetic Brain),即仿脑及融脑之意。
类脑研究要全面实现“懂脑、仿脑、连脑”,脑认知基础、类脑模拟、脑机互联三个方面缺一不可。因此,可以将类脑研究主要内容归纳为三个方面:信息手段认识脑、计算方式模拟脑、脑机融合增强脑。其中,信息技术贯穿始终。[9]
类脑智能
类脑智能是以计算建模为手段,受脑神经机制和认知行为机制启发,并通过软硬件协同实现的机器智能。类脑智能系统在信息处理机制上类脑,认知行为和智能水平上类人,其目标是使机器以类脑的方式实现各种人类具有的认知能力及其协同机制,最终达到或超越人类智能水平。
日本在2008年就提出了“脑科学战略研究项目”,重点开展脑机接口、脑计算机研发和神经信息相关的理论构建;欧盟在2013年提出“人类脑计划”(HBP),重点开展人脑模拟、神经形态计算、神经机器人等领域研究;美国也同时启动了“BRAIN计划”,将大脑结构图建立、类脑相关理论建模、脑机接口等列为研发重点;韩国在2016年发布《脑科学研究战略》,重视脑神经信息学、脑工程学、人工神经网络、大脑仿真计算机等领域的研发。2018年8月,Gartner公司发布新兴技术成熟度曲线,公布了五大新兴技术趋势,其中类脑智能、神经芯片硬件和脑机接口作为重要技术趋势。
全球顶尖高校和技术公司也加入了类脑计算和类脑智能的布局。IBM推出了TrueNorth类脑芯片,试图抢先打造类脑计算系统;受欧盟脑计划支持的英国曼彻斯特大学和德国海德堡大学研发的神经拟态计算系统,分别推出了SpiNNaker芯片和BrainScaleS芯片。微软提出了意识网络架构,声称是具备可解释性的新型类脑系统;谷歌在现有谷歌大脑基础上结合医学、生物学积极布局人工智能。
我国积极加速类脑智能计划。我国在2016年《“十三五”国家科技创新规划》中也将脑科学与类脑研究列入科技创新2030重大项目。2017年国务院《新一代人工智能发展规划》提出,2030年类脑智能领域取得重大突破的发展目标。在2017年、2018年,我国分别成立了类脑智能技术及应用国家工程实验室、北京脑科学与类脑研究中心,形成了“南脑北脑”共同快速发展的格局。
与经典技术中将多维度信息转化为一维的数值计算的信息流,以提高单位时间的运算速度这一提高时间复杂性的计算方向不同,类脑计算更强调模拟人脑的复杂的神经元连接架构(不是直接还原神经元的连接),把多维世界中的信息扩展到更复杂的空间中,利用空间的复杂性来解决计算问题,甚至同时利用时空的复杂性,来解决计算问题。所以,集成众多神经元数量、突触数量以及存算一体的神经元处理单元数量的类脑芯片,为完成仿真或模拟提供计算、存储、通信等基础硬件支持,是实现类脑计算的关键因素,而构建类脑计算芯片的阵列集成系统,是目前国际通行的大规模类脑计算系统的技术路线。[10]
类脑智能发展有三个层面的目标,分别是结构层次模仿脑、器件层次逼近脑、功能层次超越脑。具体来说,结构层次,主要研究基本单元(各类神经元和神经突触等)的功能及其连接关系(网络结构),通过神经科学实验的分析探测技术完成;器件层次,重点在于研制模拟神经元和神经突触功能的微纳光电器件,在有限的物理空间和功耗条件下构造出人脑规模的神经网络系统,如研制神经形态芯片、类脑计算机;功能层次,对类脑计算机进行信息刺激、训练和学习,使其产生与人脑类似的智能甚至涌现自主意识,实现智能培育和进化,学习、记忆、识别、会话、推理、决策以及更高智能。
类脑计算
类脑计算这一想法摆脱了传统的计算模式,模仿人类神经系统的工作原理,渴求开发出快速、可靠、低耗的运算技术。类脑计算,是借鉴生物神经系统信息处理模式和结构的计算理论、体系结构、芯片设计以及应用模型与算法的总称。20世纪80年代末,美国科学家Carver A. Mead首次提出类脑计算的概念。近年来,类脑计算研究受到了越来越多的关注,实现类脑计算先要打破冯·诺依曼架构的禁锢,在了解类脑计算之前,我们简单介绍现在主流的计算机架构——冯·诺依曼架构。
众所周知,现有计算机都是基于“冯·诺依曼”架构实现的,其处理器工作原理就是按分时复用的方式,将高维信息的处理过程转换成一维时间序列的处理过程。这一计算架构的特点是计算与存储分离,结构简洁、易于实现高速数值计算。冯·诺依曼架构在处理包含非结构化、时空关联信息的感知、认知以及决策等相关问题时,表现出效率低、能耗高、实时性差等问题,甚至无法构造合适的算法。即使是当今最先进的计算机,也难以完成一只昆虫能够轻易实现的环境感知与适应等相关任务。
而人类大脑却是一个与冯·诺依曼架构正好相反的“计算器”,虽然人脑不擅长高速率大规模数值计算,但是人脑可以在有限尺寸和极低能耗下,完成复杂环境下的信息关联记忆、自主识别、自主学习等认知处理,实现这一“计算”的基础正是脑神经网络的多层次复杂空间结构和脑神经的高度可塑性。
基于人脑的这些特点,科学家们提出非冯·诺依曼架构的类脑计算,就是借鉴大脑神经网络,存储计算一体化,将高维信息放在多层、多粒度、高可塑性的复杂网络空间中进行处理,使其具有低功耗、高鲁棒性、高效并行、自适应等特点。类脑计算既适用于处理复杂环境下非结构化信息,又有利于发展自主学习机制,甚至最终有望模拟出大脑的创造性,实现类脑智能,是一种更具通用性的人工智能。
1990年,美国加州理工大学卡弗·米德教授尝试用硬件电路来模拟神经网络,提出了“神经拟态计算”的概念,并将其定义为“采用以模拟器件仿真生物神经系统的VLSI来实现大规模并行的自适应计算系统”。“神经拟态计算”正式开启了类脑计算的研究和实践。类脑计算主要以“人造超级大脑”为目标,借鉴人脑的信息处理方式,模拟大脑神经系统,构建以计算为基础的“虚拟人脑”。
2017年计算机图灵奖的得主大卫·帕特森和约翰·轩尼诗表示,“未来十年是计算架构发展的黄金十年”。类脑计算系统通过理论论证与原型实验证明该类系统的硬件完备性与编译可行性,并扩展了类脑计算系统应用范围使之能支持通用计算。类脑计算处于起步阶段,国际上尚未形成公认的技术标准与方案,类脑计算系统研究有利于自主掌握新型计算机系统核心技术。
现有类脑计算系统方面的研究多聚焦于具体芯片、工具链、应用和算法的创新实现,而对系统基础性问题,例如计算完备性、系统层次结构等思考不足,导致软硬件紧耦合、应用范围不明确等一系列问题。但从现有通用计算机的发展历史与设计方法论来看,完善的计算完备性与软硬件去耦合的层次结构是计算系统蓬勃发展的计算理论与系统结构基础。
超级计算机的发展能够让科学家更好地推进计算模拟的进程;互联网、大数据和云计算的发展可以构造一个无比复杂的数字世界,可以形成与数字大脑类比的复杂镜像世界。而由于新的测量技术和纳米材料等基础技术的发展,又正在逐步揭开人类大脑的结构和运行原理,并且为我们开发出高效能、高密度的芯片器件提供了基础。[11]
类脑智能芯片
类脑智能芯片也称类脑芯片,是借鉴人脑处理信息的基本原理,面向类脑智能而发展的新型信息处理芯片,可分为类脑计算和类脑感知芯片。类脑计算芯片是借鉴脑科学基本原理,面向类脑智能发展的非冯·诺依曼新型信息处理芯片。有别于提供专有算法的加速平台,类脑计算芯片旨在像大脑一样以低功耗、高并行、高效率、通用、强鲁棒和智能地处理各种复杂非结构化信息。类脑感知芯片是借鉴生物感知基本原理实现信息感知的新型芯片,作为类脑计算芯片的信号输入器件,类脑感知芯片为类脑计算芯片提供高灵敏、精确、高速的感知信息,有效地保障类脑计算芯片正确地进行学习、记忆、识别、认知和决策等智能化处理。(https://www.daowen.com)
类脑芯片技术是一项新兴技术,目前没有明确的技术方案和研究路线图,美国、英国、德国、法国、韩国、日本、瑞士、新加坡、中国等国家的研究团队分别从架构、模型、集成电路、器件、编解码、信号处理、设计、制程、集成、测试和软件等各个层次探索类脑芯片的解决方案。类脑芯片是类脑智能发展的基石,特别适合实时高效地解决不确定及复杂环境下的问题,可以赋能各行各业,全面带动工业、农业、医疗、金融以及国防等各行业的飞速发展。
类脑芯片目前没有公认的技术方案和研究路线图,全球的研究团队分别从架构、模型、集成电路、器件、编解码、信号处理、设计、制程、集成、测试和软件等各个层次探索类脑芯片的解决方案。类脑芯片架构是基础,由于大脑信息编码具有时空融合特性,国外主要类脑芯片均采用时空融合架构,支持具有高度时空复杂性的脉冲神经网络算法模型。按数据表达分类,目前类脑计算芯片架构分为数字型架构、模拟型架构和数模混合型架构。利用超大规模集成电路来实现神经网络模型,用于构建类脑的感知和计算系统,是由Carver A. Mead等人在20世纪80年代末提出的。以类脑计算方案与传统冯·诺依曼架构背离程度为标准,可将方案的层次从上到下大致分为程序级、架构级、电路级和器件级等层次。据此,现有主流方案代表有:英国曼彻斯特大学的SpiNNaker是程序级的代表,IBM的TrueNorth、Intel的Loihi和清华大学的Tianjic是架构级的代表,德国海德堡大学的BrainScaleS是电路级的代表,美国斯坦福大学的Neurogrid是器件工作状态级的代表。
除了基于硅技术的类脑芯片外,还有基于新型纳米器件的类脑芯片,例如阻变存储器和忆阻器阵列(STT-RAM、PCM、RRAM等)。这种芯片直接利用定制的器件结构来模拟生物神经元的电特性,集成度更高,是非常有潜力的类脑芯片方案。但是目前大规模阻变存储器制造工艺相对不成熟,一致性和重现性都较差,现在还没有与基于硅技术的类脑芯片规模相当的芯片。
类脑芯片研究的核心是要借鉴哪些脑科学原则,在类脑芯片中表达、存储、计算和传输信息,用芯片和软件协同设计去控制、调度和管理信息。目前主要采用的核心技术包括存算一体、事件确定、高度并行、异步、稀疏编码和异构融合等。利用未来计算机架构发展的黄金十年,需要扩展图灵计算架构,利用模型、芯片、软件协同设计的方式创新发展类脑芯片。
人工智能发展碰到的问题,例如不确定性新问题或不完整的知识,动态、多体系多模态复杂系统等,最好的解决方案是发展类脑通用智能,类脑芯片是类脑智能的基石,类脑智能可以赋能各行各业,全面推动工业、农业、医疗、金融以及国防等行业飞速发展。
类脑智能技术体系
类脑智能技术体系分为四层:基础理论层、硬件层、软件层、产品层。基础理论层基于脑认知与神经计算,主要从生物医学角度研究大脑可塑性机制、脑功能结构、脑图谱等大脑信息处理机制研究;硬件层主要是实现类脑功能的神经形态芯片,也就是非冯·诺依曼架构的类脑芯片,如脉冲神经网络芯片、忆阻器、忆容器、忆感器等;软件层包含核心算法和通用技术,核心算法主要是弱监督学习和无监督学习机器学习机制,如脉冲神经网络、增强学习、对抗神经网络等,通用技术主要包含视觉感知、听觉感知、多模态融合感知、自然语言理解、推理决策等;产品层主要包含交互产品和整机产品,交互产品包含脑机接口、脑控设备、神经接口、智能假体等,整机产品主要有类脑计算机、类脑机器人等。
类脑智能当前存在先结构后功能和先功能后结构两条发展思路。先结构后功能,主要指先研究清楚大脑生理结构,然后根据大脑运行机制研究如何实现大脑功能;先功能后结构,主要是先使用信息技术模仿大脑功能,在模仿过程中逐步探索大脑机制,然后相互反馈促进。两条发展思路各有千秋,功能和结构的任意发展突破都会推动类脑智能的极大发展,因此现阶段两条路线并行发展。
类脑智能目前整体处于实验室研究阶段,脑机接口技术是类脑领域目前唯一产业化的领域。脑机接口技术是在人或动物脑(或者脑细胞的培养物)与外部设备间建立直接连接通路,以“人脑”为中心,以脑信号为基础,通过脑机接口实现控制人机混合系统。脑机接口应用于医疗领域,实现瘫痪人士通过脑机设备控制机械臂完成相应动作,也可实现对多动症、癫痫等疾病采取神经反馈方式做对应的恢复训练;用于智能家居,实现意念控制开关灯、开关门、开关窗帘等,进一步控制家庭服务机器人。全球最受关注的脑机接口公司前十名多分布在北美和欧洲,我国产业界逐步推出产品,如科斗脑机、海天智能等公司研发生产出植入式脑微电极、脑控智能康复机器人等产品。
加快构建全景战略视图,突出重点方向。从科研、技术和产业等多维度形成类脑智能体系化布局,并突出重点发展方向,具体围绕结构、器件、功能三个层面开展重点布局和超前部署。加大对基础工艺、算法、软件等的投入力度。我国长期以来在新算法、新结构、新原理的研究方面原创不足,缺乏类脑智能整体创新供给能力。因此,仍需持续加大对原始科研创新的重视力度,对关键基础工艺、算法、软件等加大支撑投入力度。强化政产学研合作,推动技术体系化创新。类脑智能体系涉及要素较多,需要政产学研紧密合作,深化多方协同的合作,共同推动技术实现体系化的创新。借鉴其他先进国家布局经验,突出政产学研多方合作在类脑智能创新中的合力作用,构建国内多方协同的创新体系。
认知智能中的沟通体系
从认知智能整体技术体系架构上来说,沟通层在情感层的上层,意识层的下层。沟通能力是类脑能力最核心能力之一。机器人只要学会了沟通,并且能够和人类顺畅沟通,那么机器人基本上就具备了除意识之外的人脑各大核心能力,沟通是类脑核心能力的综合运用。因此沟通能力是衡量机器人智力水平的最重要依据之一。沟通层技术体系主要包含以下几个方面:语言应用体系、思想观念体系、表情控制体系、肢体控制体系。
以上四个方面是沟通的核心,同时还包括类脑能力的其他层,比如情感层、逻辑层、认知层等。类脑的整体沟通技术体系,除了本层所列出的技术体系,认知智能的技术体系同样重要。最终都是为了配合沟通而形成的技术体系。所有的大脑能力,基本上都或多或少在为沟通服务。机器人沟通顺畅之后,那么大脑的意识层也有了最好的支撑和验证。同时沟通层也是检验其他技术是否成熟的核心标准之一。
构建机器人类脑的沟通能力,首先要明确沟通所依赖的机器人其他方面的类脑能力。沟通体系并非孤立的存在,机器人的类脑沟通技术体系的构建也并非单纯的语料库能够解决的,即使语料库已经庞大到上千亿数据级别,也是无法具备类脑的沟通能力的。这里的核心是类脑的沟通能力要依赖于类脑的记忆、学习、理解、认知、逻辑、情感、思想观念的能力的支撑。而现在主流的技术体系,基于语料库构建起来的技术体系,是不具备这些方面能力的。因此不可能构建出来类脑模式的沟通技术体系。即使在理论体系上,也还在摸索阶段。因此现在主流的技术体系无法构建起类脑模式的沟通体系。
认知智能中的沟通体系构建主要从以下几个方面进行:第一,构建感知、记忆、学习、理解、认知、逻辑、情感等类脑方面的技术体系形成这几方面的类脑能力。第二,构建思想观念体系。思想观念体系包含理想、目标、兴趣、性格、看法、意见等方面的类脑能力。这块需要分开成各个子系统独立构建。对万物做独立镜像,记录万物的独立镜像信息,整体支撑起来思想观念体系。因此这些方面的万物镜像和各个分支图谱是不能少的。第三,构建语言组织体系(NLG)。语言组织体系要做到类脑模式,就要彻底摆脱语料库和人工设置。机器人有了记忆学习认知理解体系之后,底层的结构化数据就系统地形成了,结构化数据的承载体系是万维图谱。有了系统化的结构化数据和万维图谱的支撑,再配合其他方面的类脑能力和语言体系的知识(语法、句法、修辞手法)就可以支撑起来系统化的类脑的NLG体系。第四,构建肢体表情体系。特指需要身体(包含硬件身体和虚拟身体)、表情和肢体动作与沟通体系配合起来,达到综合应用的效果。不然很容易貌合神离。
机器人和人类的交互沟通是最重要的方式之一,沟通技术体系的应用可以从根本上解决人和机互通的问题。这里的前提是机器人的沟通能力要足够强才行。这里的足够强非标准意义的数据,具体来说,机器人和人类沟通的通畅性要达到95%以上才行。这里评估的标准包含意图识别率,跑题率,理解率,语言组织合理率等方面。如果这些方面的合理率都能够达到95%以上,基本上机器人就摆脱了智障的情况。真正地走向智能,而非停留在智障阶段。另外对沟通的评估,还要从人类的不同年龄段来进行评估,不可一概而论。从人脑的角度来说,儿童与青少年和成年人相比,其沟通能力和水平完全不可同日而语。因此要从多方面进行评估。[12]
机器人沟通能力成熟之后,可以让万物产生智能,万物互联,之后万物智能。当然这里的万物是指各种智能设备。万物智能之后,目前很多互联网的业务和移动互联网的业务,未来都可以交给机器人来进行处理,节省大量时间成本、人力成本,全新的商业模式也会随之诞生,彻底走向智能时代。比如智能社交、智能电商、智能生活、智能家居、智能出行、智能文娱等方面,其应用场景基本无限制,向下兼容人工智能的业务和各种互联网业务。因此认知智能中的沟通体系尤其重要,是万物智能的基础,是新一代智能体系的核心基础。
沟通是人与人之间、人与群体之间思想与感情的传递和反馈的过程,以求思想达成一致和感情交流的通畅。沟通的信息流表达:信息时间域流——记忆;信息空间域流——宿原;信息时空域流——传播。沟通的本质就是信息的流通,人类和机器人之间的沟通就是人类和机器人之间的信息对流互通。既然本质是信息的流转,那么信息的质量就是很关键的方面。机器人以及智能设备是否能够传递给人类有价值的信息,也需要作为重点考虑的方面。沟通从形式上来说,包含语言沟通、肢体沟通和表情沟通三大核心方面。
沟通体系的构建难度非常大,沟通体系基本上涉及各种各个层次类脑能力(具体可以参考认知智能整体技术体系架构)。沟通体系绝对不是孤立存在的,如果不依赖和结合其他方面的类脑能力,那是不可能做好类脑的沟通模式和技术体系的。认知智能的沟通体系应用无限制,向下兼容人工智能体系、互联网体系、移动互联网体系等。认知智能体系成熟之后,各个行业都可以全面升级改造。进入新一代智能——认知智能时代,未来的前景非常广阔,新一代智能——认知智能是科技领域的新高峰。[13]
类脑智能是人工智能的最高形态
当前人工智能存在两种形态:一种形态是以模型学习驱动的数据智能,另一种形态是以认知仿生驱动的类脑智能。现阶段人工智能发展的主流技术路线是数据智能,但是数据智能存在一定局限性,如数据方面,需要海量数据和高质量的标注;自主学习、自适应等能力弱,高度依赖于模型构建;计算资源消耗比较大,CPU、GPU消耗量巨大;缺乏逻辑分析和推理能力,仅具备感知识别能力;时序处理能力弱,缺乏时间相关性;仅解决特定问题,适用于专用场景智能。
类脑智能可以解决数据智能的局限性和不足。数据方面,类脑智能可处理小数据、小标注问题,适用于弱监督和无监督问题;更符合大脑认知能力,自主学习、关联分析能力强,鲁棒性较强;计算资源消耗较少,人脑计算功耗约20瓦,类脑智能模仿人脑实现低功耗;逻辑分析和推理能力较强,具备认知推理能力;时序相关性好,更符合现实世界;可能解决通用场景问题,实现强人工智能和通用智能。
人工智能可以略分为三大分支:(1)逻辑主义(logicism),又称为符号主义、心理学派或计算机学派;(2)联结主义(connectionism),又称为仿生学派或生理学派;(3)行为主义(actionism),又称为进化主义或控制论学派。目前看来,以人工神经网络为主的理论,即联结主义学派的成果推动了第三次人工智能浪潮。最近,逻辑主义学派的理论重新被重视,其部分手法被融入最新的人工神经网络算法之中。行为主义属于自动控制理论范畴,即学习控制理论,未来小脑仿生理论的进步将推动该学派的突破和发展。
现阶段人工智能能够进行“学习”(或称之为“训练”),主要得益于人工神经网核心理论——反向传播(Back Propagation,BP)网络的提出,使得在神经元足够多的情况下,任意连续函数都可以被拟合出来,即通过神经网的学习方式可以实现柯尔莫哥洛夫(Kolmogrov)定理(1957年,苏联数学家)的描述。目前人工智能的“学习”主要分为三种形式。
第一种是给智能系统提供大量标注过的数据进行训练,称为有监督学习(supervised leaning)。例如,利用大量由医生标注过的X光片作为智能系统的教师信号进行训练,使智能系统通过解读X光片进行疾病诊断。显然,上述监督学习方式依赖于大量标记的训练数据,但收集和标记大型数据集的过程非常耗时、昂贵且信赖度难以保证。
第二种是无监督的学习方式(unsupervised learning),相较第一种则具有更大优势,因为此类学习方式虽然也需要大量数据进行训练,但它与监督学习的不同之处,在于我们事先不需要对训练样本进行标注,而是直接对数据进行建模,通过找到数据本身的规律来约束学习过程。这听起来似乎有点不可思议,但是在我们自身认识世界的过程中经常依赖于无监督学习,例如我们长期反复经历某类事件便可总结出该类事件的规律和经验。
第三种是通过设定规则来判断在某种场景下智能系统做出的结论或动作是“好”还是“坏”,并以此对该智能系统进行“奖励”或“惩罚”。这个过程周而复始,性能也会逐渐提高。这种学习方式被称为强化学习(reinforcement learning)。人工智能通过这种学习方式可以主动快速地获取知识,改进行动方案以适应环境。关于强化学习最典型的案例莫过于谷歌的AlphaGo Zero,其完全摆脱人类棋谱,通过和不同版本的自己下棋的方式反复训练得到知识,最终打败利用人类棋谱知识进行学习并打败人类的AlphaGo。[14]
与无监督学习通过挖掘数据规律进行训练不同,强化学习依赖于与环境的交互进行学习。例如,在向用户推荐产品的任务中,非监督学习会分析用户先前经常使用的产品并向他们推荐类似产品,而强化学习将通过向用户不断推荐一些产品,并依据获得的用户意见进行学习,最后构建出用户可能会喜欢的产品列表。综上所述,人工智能主要分为监督学习、无监督学习、强化学习这三种学习方式,强化学习是未来自主人工智能主动学习的最重要训练模式。
自主智能的感知—智能—操控环路。若要人工智能系统像人一样进入自然环境并实现自主智能,从系统仿生的角度看,除处理和判断信息的智能系统外,还需要感知系统获取环境信息,获得的数据通过智能系统分析决策后借助动作操控系统对环境进行改变,再通过感知系统判断智能系统的动作效果是否符合规则规定,即判断是好还是坏,以此对智能系统进行奖励或惩罚。如此循环往复地与环境产生交互,便可达到自主学习的效果。
由此可见,从感知到智能再到操控然后再回到感知这样一个无限循环的闭环系统便是人工智能系统在自然环境下自主学习的必要条件。开发具备这个闭环功能的类脑智能系统是自主人工智能研究的关键。大部分的所谓智能机器人都在表象上具备了这个智能闭环系统,但实际上真正具备自主学习能力的智能机器人尚未出现。究其根本原因,是若要实现这个闭环,还需要更全面、更细致的功能划分。
人工智能系统通过传感器主动获取环境信息进行自主学习的必要条件之一是具备从近乎无限多的信息中挑选和抽象出有用的、重要的乃至急需的信息的能力。对传感器获取的信息进行挑选、加工和处理虽然是传感器功能的一部分,但是也与智能有着无法分割的关系,特别是视觉和听觉这样的高级传感器,没有智能处理就无法提取和获得有用信息。比如目前机器视觉中广泛研究的三维重建、定位导航、检测识别三大类智能处理算法,就试图从图像传感器采集的二维信息中获得有用的时空、类别等信息。但是,这种对原始信息进行挑选、加工与处理的“信息处理智能”与获得有用信息后对环境态势的分析、对行动的决策所需要的“分析决策智能”是完全不同的。[15]
当智能系统作出决策后,按照决策进行行动规划的能力即“行动规划智能”和付诸行动的能力即“运动控制智能”是主动改变自身与环境的关系乃至改变环境本身的手段。行动规划智能与运动控制智能也是与上述信息处理智能和分析决策智能不同形式的智能,而付诸行动后如何来认识被改变的环境态势,如何判断智能系统的动作是“好”还是“坏”是智能系统学习与训练的关键,这又回到了传感器和信息处理智能的功能上。
当然,要实现能与人类智慧媲美的人工智能系统,其智能系统结构仍然远远不够。生物脑系统的进一步解析将会对未来自主智能系统的研究提供重要线索。例如,简单反馈控制回路可以在脑干神经系统中找到,高性能运动控制系统已被证实存在于小脑。然而小脑的结构与大脑差别很大,形成了完全独立的器官,说明运动控制智能单元的原理与其他智能处理单元有着本质的不同。另外,如果把大脑中的视觉初级脑区和听觉初级脑区当作信息处理智能单元,把额叶前区视为分析决策智能单元的话,初级脑区与额叶前区之间存在韦尼克区(Wernicke’s area)和布罗卡区(Broca’s area)等各种中间功能的脑区,暗示着从信息处理智能单元到分析决策智能单元之间还存在多个步骤。这些生物脑的研究和解析成果对自主人工智能系统的构建和发展有着至关重要的启迪作用。
人工智能在很多方面超越人类的智力是必然的,否则人工智能的实用价值将大打折扣。大数据运算、云计算、因特网、物联网、区块链等技术非常适合于融入人工智能,而人类大脑较难直接融入这些技术。目前,这些技术产生的信息和功能与人类大脑间的信息交互还停留在通过键盘、屏幕、麦克风及扬声器等设备与手指、眼睛、嘴、耳朵等脑外器官之间的交流,尚未像人工智能系统那样可以轻易做到“你中有我、我中有你”的程度,这也正是人类大脑智力水平进一步发展的瓶颈和局限性所在。
尽管脑机接口是目前研究的一个热点,但很难想象人脑会像终端计算机一样轻松与上述网络系统连接并达到信息融合。这也是人脑将会成为新的旧脑(大脑和小脑出现之前的低等动物的脑),而人工智能系统将会成为更高一级脑的理由。未来的人类将会改变通过视觉、听觉、触觉与人工智能交流的方式,通过脑机接口更直接地操作人工智能系统这个新的“超级大脑”。[16]