国外人工智能技术发展状况

(一)国外人工智能技术发展状况

20世纪40年代中期,计算机科学奠基人图灵在他的论文《计算机器和智能》(Computing Machinery and Intelligence)中提出了著名的“图灵测试”——如果一台机器能够通过电传通信设备与人展开对话,并且被人误以为它也是人,那么我们就认为这台机器具有智能。到了20世纪50年代,在达特茅斯学院(Dartmouth College)召开的首届人工智能大会正式确立这一概念。人工智能的发展几经波折。直到21世纪初,尤其是2012年以来,社会化媒体应用、移动互联网、大数据、云计算等技术的广泛应用构成了互联网泛在智能发展的基础。[1]数据的可用性、连接性和计算能力的提高,使机器学习取得了突破性的成就,投资数量的增加以及人工智能技术前景的乐观,人工智能及其附属技术的落地应用极大地改变了社会形态与社会生活

1.国外人工智能市场规模以及投融资数量

在过去五年间,国外人工智能领域投资出现了一个快速增长期。国外人工智能领域融资在2017年迎来全面发展。对于全球人工智能和机器学习的初创企业而言,真正的资金跃升发生在2016—2018年。那时,风险投资者将人工智能视为一个时髦词汇,人工智能市场的商业化规模在经历了一个爆发性增长之后走向了持续平稳的发展,融资总额和投资频次保持了一个较为稳定的水平。

各大科技巨头通过投资与收购不断提高自己在人工智能领域的市场占比。但是这些投资巨头的投资偏好也不尽相同,美国几大科技巨头里,微软关注的主要领域是基础元件及硬件,而苹果涉足领域较为广泛,从基础元件及硬件、企业服务、无人驾驶、教育到金融领域均有涉足。IBM关注的重点是医疗和教育,谷歌的投资重点是企业服务和教育,Facebook的投资领域则是集中在企业服务。与中国的科技巨头相比,美国的科技巨头参与人工智能技术市场主要是以收购为主,而非通过自主投资初创企业。

纵观国内的科技巨头投资情况,阿里巴巴的投资重点是安防和基础元件,腾讯投资的重点是智能健康、教育、智能汽车等领域,而百度投资的重点是汽车、零售和智能家居等领域。京东的投资聚焦在汽车、金融和智能家居等领域。依托中科院体系的国科系则在芯片、医疗、教育等人工智能技术和应用领域均有涉足。除了财力方面的支持,周边技术的发力也是人工智能技术得以快速发展的重要原因,包括算法、数据和计算力这三个技术层面。

2.人工智能技术的再细分

人工智能技术中的代表应用技术主要包括VR/AR技术、识别交互技术、智能分词技术和知识图谱技术。

VR(Virtual Reality,虚拟现实技术)早期译为“灵境技术”。虚拟现实是多媒体技术的终极应用形式,是计算机软硬件技术、传感技术、机器人技术、人工智能及行为心理学等科学领域飞速发展的结晶。它主要依赖于三维实时图形显示、三维定位跟踪、触觉及嗅觉传感技术、人工智能技术、高速计算与并行计算技术以及人的行为学研究等多项关键技术的发展。随着虚拟现实技术的发展,真正地实现虚拟现实,将引起整个人类生活与发展的很大变革。人们戴上立体眼镜、数据手套等特制的传感设备,面对一种三维的模拟现实,似乎置身于一个具有三维的视觉、听觉、触觉甚至嗅觉的感觉世界,并且人与这个环境可以通过人的自然技能和相应的设施进行信息交互。[2]

AR(Augmented Reality,增强现实技术)则是在VR技术走向成熟之后才出现的,准确来说,AR技术可以被看作是VR技术发展的一个新阶段。20世纪90年代初期,波音公司的汤姆·考德尔(Tom Caudell)和他的同事在他们设计的一个辅助布线系统中提出了“增强现实”这个名词。[3]AR技术作为一种增强现实技术,将真实世界与虚拟世界无缝衔接起来,现实与虚拟的界限不再分明,由此消弭。

除此之外,作为VR与AR技术相结合而诞生的MR(Mixed Reality,混合现实技术)也有关注的必要。MR作为虚拟现实技术的进一步发展,它通过在虚拟的环境中引入与现实场景有关的信息,通过在用户、虚拟世界与现实世界之间搭建起一个可以互相交互反馈的信息回路来增强用户在使用中的真实感以及满足用户对于真实与虚拟交织的需求。

识别技术主要分为语音识别和面部识别两种技术。语音识别技术作为计算机科学与语言学的交叉点,既包括语言学的知识研究,也涵盖了计算机科学与电子信息工程领域的开发技术,范围广阔。语音识别技术同时也被称为“自动语音识别”。语音识别技术,一共经历了几次变革与创新。而语音识别技术在近期则主要得益于深度学习以及大数据方面的进步。这方面的进展主要体现在该领域的学术论文数量大幅度上升。更为瞩目的是,在语音识别系统的设计和制作过程中,全球的工业界都采用深度学习的方法来提高语音识别技术,包括谷歌、微软、IBM、苹果以及中国的百度和科大讯飞等。

交互技术,又称交互设计(Interaction Design,缩写IxD或IaD),是关于人造系统行为的设计领域。人机交互可定义为人利用输入输出装置与计算机对话以完成某任务的方式。[4]人造物,即人工制成物品,例如软件、移动设备、人造环境、服务、可佩戴装置以及系统的组织结构。交互技术可以分为语音识别技术、眼动追踪技术、仿生隐形眼镜技术以及人机交互技术。

人工智能的自然语言处理分析技术,大致分为两个层面:浅层分析和深层处理。浅层分析包括分词和词性标注。这两种技术只需要对句子的局部范围进行分析与处理,目前已经基本成熟了。而深层处理则需要对于目标句子进行全局分析,主要有三个层次,包括句法、语义和通用

目前人工智能技术可以做:(1)中英文混合分词功能,即自动对中英文信息进行分词与词性标注功能,涵盖了中文分词、英文分词、词性标注、未登录词识别与用户词典等功能;(2)关键词提取功能,即采用交叉信息熵的算法自动计算关键词(包括新词与已知词),关键词方便搜索、分类、推荐,同时也可以自动生产文章摘要;(3)新词识别与自适应分词功能;即从较长的文本内容中,基于信息交叉熵自动发现新特征语言,并自适应测试语料的语言概率分布模型,实现自适应分词;(4)用户专业词典功能,既可以单条也可以批量导入用户词典。

知识图谱(Knowledge Graph)是人工智能重要分支知识工程在大数据环境中的成功应用,知识图谱与大数据和深度学习一起,成为推动互联网和人工智能发展的核心驱动力之一。[5]知识图谱用结构化形式描述客观世界的概念、实体及二者之间的关系。它将互联网的信息转化成更接近人类认知的形式,同时利用大数据技术使得互联网海量信息能够更好地被组织和管理。这项技术为搜索引擎带来了新生,也在智能问答中显示强大的能力,已成为互联网的重要智能应用基础设施。

知识图谱目前可以被分为通用和特定领域两种。通用知识图谱可以被视作是一个涵盖众多领域的结构化百科知识库,而特定领域知识图谱则是一种纵深挖掘,是专业领域的知识库。

知识图谱技术的发展经历了一个过程。首先,它作为知识工程技术在21世纪这个大数据时代的发展成果而存在。爱德华·费根鲍姆(Edward Feigenbaum)对知识工程的定义是——将知识集成到计算机系统从而完成只有特定领域专家才能完成的复杂任务。[6]而到了大数据时代,知识工程技术从自动获取知识变成了连接相关知识并提供智能知识支持。知识工程能够通过大数据技术添加语义和知识,使数据变为信息然后成为知识,最终应用到实践中去,以此为用户提供决策支持、为用户解决难题。

3.融合应用型Al城市发展

目前,一批融合应用型城市的崛起也引起了学者们的注意。纽约作为美国的金融和科技中心,在人工智能的融合与应用质量方面表现出色。在融合方面,纽约高度发达的金融产业与上下顺畅的融资渠道给纽约人工智能的初创企业在成长阶段提供了必要的资金支持。而在应用质量方面,纽约致力于将自己打造成为全美国知名的智慧城市。例如,纽约在曼哈顿区西部安装电子探测仪,通过探测仪能够实时监测区域内交通、能源的使用情况和空气质量等。另外,纽约将人工智能技术与金融相结合,例如摩根大通、摩根士丹利近年来已经在智慧信贷等金融场景下推出金融服务产品。此外,纽约市政府与Cisco IBSG合作推出智慧屏幕城市24/7计划,通过将传统电话亭运用新技术改装成智能屏幕,为市民提供更方便的服务。

洛杉矶是美国另一所重要的人工智能应用城市。洛杉矶已经成功举办美国人工智能峰会、洛杉矶大数据和人工智能论坛等人工智能领域高峰会议。在应用方面,洛杉矶在智能医疗、数字政务方面都取得了很大成就。

特维拉夫作为以色列的重要创新城市之一,将人工智能深深植入了城市基因中。根据Start-up Nation Central的报告,2018年以色列人工智能公司共获得了22.5亿美元的融资,2019年以色列拥有总共1150家人工智能相关初创企业,其范围覆盖机器学习、自然语言处理和深度学习等多方面领域。同时,以色列还拥有诸如希伯来大学、以色列理工大学等众多人工智能顶尖研究大学。