2.3.3 人工智能技术现状

2.3.3 人工智能技术现状

人工智能是研究用于模拟人类智能的理论和方法的一门科学,属于自然、社会和技术科学的三向交叉学科,涉及数学、计算机科学、仿生学等诸多学科。其试图了解智能的本质,并创造出用类似人类智能的方式做出反应的机器,而深度学习的出现更加接近这一初衷。“人工智能”这一概念最早是在1956年美国达特茅斯学院夏季研讨会上被正式提出,标志着人工智能学科的诞生。此后,人工智能在经历了20世纪60年代的第一次浪潮和20世纪70~80年代的第二次浪潮后,进入了20世纪90年代的平稳发展期。在进入21世纪后,随着物联网、大数据等技术的发展,人工智能迎来了第三次浪潮,发展了包括机器学习、计算机视觉在内的核心技术,在金融、通信、交通、医疗、农业等多个行业得到广泛应用并取得巨大成功,成为“21世纪三大尖端技术”之一。作为一门综合性的前沿学科,未来人工智能将加快与其他学科的交叉融合,助力传统科学的发展。我国对人工智能的发展也给予了极大的重视:2017年发布的《新一代人工智能发展规划》,旨在抓住人工智能的重大发展机遇,提升社会生产力、建设科技强国;2021年发布的“十四五”规划,明确提出要瞄准人工智能、集成电路等前沿领域,实施一批国家重大科技项目,其中人工智能名列第一。

近几年,人工智能技术正在飞速发展。在信息技术的发展下,人工智能大幅跨越了技术与应用之间的那条“鸿沟”,无人驾驶、图像分类、知识问答、语音识别、人机对弈等应用也陆续在技术上取得了可喜的新突破。未来,人工智能将继续前行,不断突破,加速解决代表性问题,以满足社会不同人群的需求。综上所述,人工智能技术已经延伸到各行各业,且人工智能技术涉及视觉、听觉、触觉、嗅觉等各个方面,随着智能设备的出现,使人机交互变得更加自然。

在当下,人工智能技术已经完全成为一门综合研究的学科了。当然,在目前也是此类新兴综合学科当中最具有研究价值,研究涉猎范围最为广阔的。这些关键技术主要包括七大类,①机器学习;②知识图谱;③自然语言处理;④人机交互;⑤计算机视觉;⑥生物特征识别;⑦虚拟现实等。当然,从人工智能与政府宏观决策融合的进程来看,也是这些关键技术的部分应用[77]

(1)机器学习

根据不同的研究背景,机器学习拥有诸多的定义。其中,比较有代表性的定义为对输入的数据集进行分析,发现隐含在数据背后的未知关系,同时以可理解的、有价值的方式对数据进行总结。机器学习主要的任务包括对数据的预测和描述。

柯尊旺[78]通过利用机器学习模型,对网络舆情分析的若干关键技术开展理论及应用研究,提出了一种运用自然语言解释来生成、增强数据集的方法,并实现一个从自然语言解释中学习外部知识的情感分析模型。郑江元等人[79]基于LightGBM(Light Gradient Boosting Machine)机器学习算法构建的子痫前期预测模型具有较高的预测效果,能够有效预测重庆地区孕妇子痫前期的发生,为临床医师提供决策参考。

(2)知识图谱

知识图谱,旨在使用统一的标准格式来汇集、管理、表达Web上的多源异构知识,使得信息检索从朴素的关键字匹配,转向理解语义和识别意图之后的智能搜索。其本质而言,知识图谱是一种语义网络,即一种具备有向图结构的知识库。知识图谱通过将现实世界的概念、实体映射为图结构中的节点,且将这些概念与实体之间的关系,表示为图中的边,从而表达现实世界的客观事实[80]

乔一丹等人[81]基于知识图谱把握智能调度领域的学科演化性质、分析领域研究热点、探索重要集群性质、挖掘重大突现、洞察结构变异性,提出一种基于知识图谱的研究领域综述分析路径与方法。余正勇等人[82]借助CiteSpace可视化软件构建了山地旅游研究的知识图谱,客观呈现了其演变、发展与趋势走向。

(3)自然语言处理

自然语言处理的问题是人工智能领域中的子问题,其目的是使计算机可以高效地理解人类的语言,并且可以代替人类完成特定的任务。自然语言主要是指人类在交流中使用的语言不仅具有歧义性,而且它随着人类社会的发展会不断地演变。当今流行的处理方法分为基于规则的方法和基于统计的方法两种。前者是基于语言使用中所表现的规则进行处理,后者根据对大规模数据进行统计分析发现潜在的规则从而实现对数据的处理。拥有大规模且优质数据对于自然语言处理工作尤为重要。自然语言处理任务主要包括:分词、命名实体识别、词性标注、机器翻译、文本分类、情感识别等。

奚雪峰[83]通过利用基于TS LSTM(Title Semantic-Long Short Term Memory)的文本分类模型,对LSTM网络内部结构进行了改进,使得LSTM网络在迭代的处理句子时可以考虑到主题信息。蔡启航[84]在分析媒体情绪对股票收益率的影响时,利用自然语言处理原理在相应指标的构造上既采用了学界通用的主成分分析方法构造投资者情绪指标,也通过自然语言处理的方法处理新闻文本信息得到媒体情绪指标,拓展了已有研究。

(4)人机交互

人机交互技术是指通过计算机输入、输出设备,以有效的方式实现人与计算机对话的技术。

罗勇[85]在针对情境感知智能人机交互关键技术研究时,提出了一种基于结构相似性时空分析的情境感知光照均衡方法。利用光照补偿结构图与物体光反射特性,获取光照补偿空间分布,通过计算两帧之间非动态物体的光照变化量估计光照时变情况;在基于时间和空间的光照补偿基础上,结合对数直方图均衡算法,实现对视频的快速光照均衡化;胡中旭[86]在进行常用人机交互手势识别研究中,为解决深度神经网络对数据的依赖问题,以及手势姿态数据获取成本高的问题,充分挖掘数据集的内在信息研究无监督/弱监督学习方法,结合手势估计数据图像自身特点以输入图像重建为弱监督目标,研究了基于对抗自编码的弱监督优化模型提高了预测的准确率,同时还对数据的内在维数进行了探讨。

(5)计算机视觉

计算机视觉是一门研究如何使机器“看”的科学,更进一步地说,就是指用摄像机和计算机代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使计算机处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取“信息”的人工智能系统[87]

梁春疆等人[88]提出一种用于检测大尺寸舱段的位姿检测算法。搭建了基于双目视觉的舱段位姿检测系统,对相机、镜头、舱段位姿调整平台进行选型。设计了舱段位姿检测的整体流程。拍摄舱段端面的局部图像,将舱段端面的螺栓孔作为检测对象。在螺栓孔检测过程中,对现有的基于弧支撑的椭圆检测算法进行了改进,使算法能够检测到螺栓孔对应的椭圆方程。计算端面螺栓孔的圆心的空间坐标。根据螺栓孔圆心建立舱段坐标系,计算出舱段位姿。

冯波[89]针对纸病诊断过程中的光源优化问题,提出基于动态寻优的自适应阈值纸病判定方法,通过实验法获取不同时间段图像灰度数据,依据获取数据的时间段对图像灰度数据进行分类,求得相应时间段的灰度最大平均值、灰度最小平均值、总体灰度平均值以及灰度标准差,应用图表分析法对图像灰度各种数据进行对比分析,总结出图像灰度变化规律,并验证显示此方法可以较好地适应外界光线的变化,提高纸病判定系统的鲁棒性。

(6)生物特征识别

生物特征识别信息(简称为生物识别信息)是指“对自然人物理、生物或行为特征进行技术处理得到的能够单独或者与其他信息结合识别该自然人身份的个人信息”。

姚永贤[90]以应用场景最多的警察执法为例,通过实证分析警察机构收集、比对、应用生物识别信息过程中,对个人信息权可能造成的风险,确立应用生物特征识别技术法律规制路径,即从个人信息权的角度出发,确保个人信息知情权、访问权、修改权、救济权等法定权益的实现,建立外部监督机制,实现公共机构应用生物特征识别技术社会治理的法治化。

竺乐庆[91]针对手部特征的多模态生物识别提出的手部特征包括2D指形、指节纹、掌纹特征,在单一模态生物特征研究的基础上,为改善大数据库搜索识别的时间性能,采用基于“与”规则的决策级多模态融合方案,设计了一种由粗到细、由快到慢排列的层次匹配器,从而实现了既具有较高识别精确度,又具备较理想的大数据库检索时间性能的多模态生物识别系统,并进行了实验评估。

(7)虚拟现实

虚拟现实(Virtual Reality,VR)是计算机通过数字化手段营造的,虚拟全景模拟环境,以视觉和听觉表现为基础,所显示的是现实世界的镜像再现或者是完全人为创造的梦想世界的任何整体环境,体验者完全沉浸其中,并可以通过一定的技术手段和虚拟环境或该空间中的物体进行各种形式的交互。沉浸式交互虚拟现实,是包括VR/AR(Aug mented Reality)等覆盖视野、沉浸式的、可在空间行走的、可体感交互的、基于虚拟现实引擎即时渲染的空间信息体验方式。

吴南妮[92]从艺术设计的角度分析沉浸式虚拟现实交互设计,梳理设计的概念与内容,分析虚拟现实交互艺术设计包含的元素、设计原则及评价标准,探讨虚拟现实交互艺术设计的概念原理。

李治军[93]以大连远洋30万吨级超大型油轮“远山湖”号的舵机舱为虚拟设计对象,研究设计基于该舵机舱的虚拟现实系统。主要研究内容包括分析整理相关设备的尺寸数据,对比不同角度的舱室特写照片,建立了完整的舵机舱三维模型,该模型与实船舵机舱有很高的相似度。将船舶舵机舱三维模型导入虚拟现实引擎Unity 3D中,实现了虚拟舵机舱室第一人称漫游,实现了舱室设备的交互操作,并设计了可拓展的用户交互界面,完成了最终虚拟场景程序的生成和发布。