附录 相关知识
附录 相关知识
什么是人工智能?
1956年夏季由美国数学家、计算机科学家和人工智能早期研究者John McCarthy等人倡导,在达德茅斯大学召开了首次人工智能研讨会,在此次会议上正式将人工智能作为一门独立学科。“人工智能”(Artificial Intelligence,缩写AI)一词由McCarthy提出至今,尚难以给出一个确切的定义。其主要原因是人类能够了解到的唯一智能就是自身的智能,但对于自身智能的产生、变化、构成等诸多要素都知之有限,还没有一个全面化、系统化的认知。通常认为智能是人类有别于其他动物的独有属性,但由于对智能的本质所知不多而难以理解。
那么,什么是人工智能呢,顾明思义就是人造智能。目前的“人工智能”一词是指用计算机模拟或实现的智能,因此,现在的人工智能又称机器智能。“人工智能”同时又是一个学科名称,作为学科,人工智能研究的是如何使机器(计算机)具有智能的科学和技术,特别是自然智能(包括人和其他生物的智能)如何在计算机上实现或再现的科学技术。因此,人工智能的研究不仅涉及计算机科学,而且还涉及逻辑学、语言学、心理学、脑认知科学、行为科学、生命科学、信息科学、系统科学、数理科学等诸多学科领域,这就是说,人工智能实际上是一门综合性交叉学科和边缘学科。
尽管对智能的本质还知之不多,科学家还是试图对AI给出各种定义,以便对该学科的性质、研究的问题、研究方法、研究方向给出一些理解,如,Marvin Minsky的定义是:人工智能是研究使机器人能做的需要智能的工作的一门学科。
该定义是面向机器的,并且“需要智能的工作”,似乎容易理解,如下棋、驾车、编写程序等都是需要智能的工作,不会有什么争议,但该定义隐含着智能是人类独有的属性。
由G·F·Luger给出的定义是:人工智能是计算机科学中关于智力行为自动化的分支。该定义确信A1是计算机科学的一部分,因此必须基于计算机科学的合理理论和应用原理。这些原理包括用于表示知识的数据结构、应用知识所需的算法,以及用于实现的语言和程序设计技术。然而,上述两个定义都不能回避定义或理解“智能”的困难。
实际上,人工智能的部分魅力是为精确探讨智能的属性提供独特而强有力的工具。AI为智能理论的研究给出手段和试验平台,这些理论可按计算机程序语言叙述,并且通过在计算机上运行这些程序进行测试和验证。因此,AI的上述二定义并未达到对该领域的清晰定义。
关于AI的学科定义,J·Hopcroft在ACM图灵奖演说中更明确地指出:“计算机科学的潜能若充分开发和探讨,将使我们走向关于世界知识的更高水准。计算机科学将帮助我们获得对智力过程的深入理解。这将增进我们关于学习、思维和推理过程的知识。计算机科学将为认知科学提供各种模型和概念工具。完全与物理科学在20世纪人们探讨物质的本质和宇宙起源期间统治了许多人智力上的努力相同,今天我们开始探讨思想、知识结构和语言的智力世界,我预见到不断做出的重要进展将使我们的生活有重大改变。”
由于科学家的不懈努力,目前人工智能的研究已取得了重要进展,使人们对智能有了进一步的理解。
按照AI研究已取得的各种成就的经验及当前人工智能发展的趋势进一步定义为:人工智能研究构成智力行为基础或呈现智力行为的机制,途径是构造与评价按制定的这些机制设计的人造物。
按该定义,人工智能不太是关于构成智能基础或呈现出智力行为的各种机制的理论,更多的是构造与测试支持这种理论的各种可能模型的试验方法学。它承诺以模型求精和进一步实验为目标,设计、运行和评价实验的科学方法。必须指出,AI的这个定义并不是定义智能,而是提出“人工”智能在探讨各种智力现象的表现和本质中的合理作用。
从科学的角度来说,人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术应用系统的一门科学。这门学科的研究范围包括语言识别、图像识别、专家系统和机器人等。人工智能是人类智慧创造的一种新型工具,是人类智慧的延伸。虽然今天的人工智能在感知和认知方面取得了不少的进步,但在情感和自主意识方面,人工智能与人类智能还有非常大的差距。
虽然我们还无法对整个“智能”做出系统性的阐述,但是我们可以在已知的范围内对“智能”进行概括。在已知的人工智能技术领域,人们认为人工智能可以被分成五个等级。
1.无法与人类进行交互的人工智能。“交互”一词可以简单理解为交流、互动。显然很多被人加工的物体仍是无法与人类进行交互的,所以只能归类到初级的人工智能之中。
2.可以与人类进行交互的人工智能。比如“智能家电”,内部一般都有控制系统,但它们无法自动升级,更不会主动去学习新的技能。人们选择按下什么键,这类电器就启动什么功能,始终不会发生什么变化。
3.可以通过外接设备进行升级的人工智能。比如手机、个人计算机等,这类人工智能可以被动升级,功能会变得越来越强大,场景设计也会越来越多。
4.可以通过云端共享信息的人工智能。除了机器人,我们最常用到的搜索引擎也属于这一等级的人工智能,用户只需要下载一个浏览器就能完成对信息的搜索、处理,这已是离我们生活最近的一种人工智能。
5.能够自主学习、创新的人工智能。这种最高级别的人工智能能够与人类交互信息,可以通过各种信息载体甚至在云端中搜集信息,并且可以创新、创造,形成新的知识的人工智能。
什么是机器人?
首先机器人是一种机器,这个机器可以有各种外形,并不是只有像人一样才能叫机器人,也不是凡能帮助人们自动完成某种任务的机器,就是机器人,它必须带有人或生物的属性,也就是要具有智能(Intelligence),有了智能的支配,才能根据外界条件的变化自动地完成某种任务。
机器人技术的本质是感知、决策、行动和交互技术的结合。机器人学科是对控制论、机械电子、计算机、材料学和仿生学的高级集成。
如果按智能程度分类,机器人可以分为三种:
1.工业机器人,它只能按照人们设定的程序去工作,而不能因为外界条件的变化,对自身的程序,也就是所做的工作做相应的调整,这是一种比较低级的机器人。
2.初级智能机器人,已经拥有识别、推理和判断的能力,可以在一定条件下,根据外界的变化自行修改程序,进而对工作作出相应的调整,不过这些修改原则,是人们预先设定好的。
3.高级智能机器人,它可以通过自己学习、总结经验来自动修改程序,而不是人们预先设定的。这类机器人已经具备一定的自动规化能力,可以不需要人的安排,自动完成工作任务。
机器人的基本结构和工作原理。机器人的组成部分和人类很相似。一个比较典型的机器人除了由一套可以移动的身体结构(机械结构系统)、一部与马达相似的装置、电源(驱动系统)之外,还由传感部分和控制以上要素的计算机——大脑(控制部分)构成。
从专业角度来说,机器人是由机械部分、传感部分、控制部分三大部分所组成,这三大部分又可以分为六个子系统(如下图)。
关于机械结构系统,工业机器人一般是由机座、手臂和末端操作器三大部分构成,使用的材料一般为金属。
NAO机器人构成图
为了使机器人顺畅运作,就需要在各个关节安置传动装置,这就是驱动系统。要使机器人运作起来,还需要一个能量源来驱动传动装置,一般使用电池或电源插座来供电。如需要机器人能像人一样拥有感受,能够从内部和外部环境状态中获得有意义的信息,这就是感知系统。感知系统通常由内部和外部传感器模块组成。当机器人对周围环境产生了感受,接下来就是要与环境产生联系,这就是机器人——环境交互系统。
目前,机器人还需要人的控制,因此使人与机器人进行联系和参与机器人控制的系统,就是人机交互系统。人机交互系统一般有电脑的标准终端、指令控制台、信息显示板、危险报警器等。控制系统是指支配机器人的执行机构去完成规定的运动和操作功能的系统。它通常根据机器人的作业指令程序和传感器反馈的信号来完成任务。控制系统具有自身目标和功能,它由控制主体、控制客体和控制媒体组成,其中有传感器、控制器、驱动器和执行机构。
现实中的机械骨骼
由于科技和人工智能的飞速发展,机器人不仅已出现在各行各业和各个领域,而且已经有了仿人机器人,这是一种集合机械、电子、计算机、传感器、相关材料以及控制技术等诸多专业技术的服务类机器人,在外形和相关设计上面,对人类进行了很多模仿,具备手、足、驱干、头部等类似人类的相关部位。
据科学家预测,要不了多久,大概2060年前后,机器人不但将和人类一样拥有思维,而且会全面超越人类。
什么是大数据?
大数据是指将人类社会的万事万物、方方面面的关系以数字的形式存储在各类软件中。人们通过各类大数据存储软件,能了解到大量信息,以此作出正确的判断和决策。据估计,全球存储的数据总量现在要以上万艾字节测量(1艾字节=10亿千兆字节),而且该数据还以自己摩尔定律似的加速增长,大约每三年增加一倍。几乎所有数据现在都以数字格式储存,因此可由计算机直接操作访问。仅google的服务器每天就要处理大约24拍字节(1拍字节=100万千兆字节)的信息量,主要是数百万用户每天在搜索的信息。
所有这些数据都有多种不同的来源。单就互联网来说,来源就包括网站访问、搜索查询、电子邮件、社交媒体互动和广告点击等。企业来源包括交易、客户联系、内部沟通,还有财务、会计和销售系统的数据等。在现实世界中,传感器还会不断捕捉工厂、医院、学校、汽车、飞机以及无数其他消费电子设备和工业设备的实时运行数据。
这些数据绝大多数都是“非结构化”数据,即捕捉的数据都是以各种格式存在,往往难以匹配或比较。大数据的非结构化性质则引领了专门用于理解各种渠道搜集的信息的新工具开发。在大数据领域计算机能够规模化处理信息,这对包括商业、医学、政治和几乎每一个自然与社会领域都产生着革命性的影响。
如大型零售商依靠大数据对单个消费者购买偏好的洞悉达到了前所未有的水平(见后面的一个例子),让他们能做出精确定位,在增加收入的同时也有助于建立客户忠诚度。全球范围的警察系统都在运用算法分析来预测犯罪最有可能发生的时间和地点,然后相应地部署警力。
在很多情况下,尤其是在商业领域,成功的最终衡量标准是赢利能力和效率,而不是深入的理解,单靠相关关系就能创造非凡的价值。大数据可以让管理层前所未有地掌握各个领域的情况,从一台机器的操作,到一个跨国公司的整体运作,这些都能进行分析,且详细程度在过去是不可能实现的。
什么是大数据?
下面通过一段对话,就知道什么是大数据了,大数据对你又有什么启发和帮助。
必胜客店的电话铃响了。
客服拿起电话:必胜客,您好!请问有什么需要我为您服务?顾客:您好!我想要一份……
客服:先生,请先把您的会员卡号告诉我,好吗?
顾客:16846146***
客服:陈先生,您好!您是住在泉州路一号12楼1205室。你家电话是26467812,您公司的电话是46665278,你的手机是1391234……。请问您想用哪一个电话付费?
顾客:你怎么会知道我所有的电话号码?
客服:陈先生,因为我们联机CRM系统。
顾客:我想要一个海鲜比萨……
客服:陈先生,海鲜比萨不适合您。
顾客:为什么?
客服:根据您的医疗记录,你的血压和胆固醇都偏高。
顾客:那你有什么可以给我推荐的?
客服:您可以试试我们的低脂健康比萨。
顾客:你怎么知道我会喜欢这种比萨?
客服:你上星期一在国家图书馆借了一本《低脂健康食谱》。
顾客:好,那我要一个家庭大号比萨。
客服:陈先生,大号的不够吃。
顾客:为什么?
客服:因为您家一共有六口人,来个特大号的,怎么样?
顾客:需要付多少钱?
客服:99元。这个足够您一家六口吃了。但您母亲应该少吃,她上个月刚刚做了心脏搭桥手术,还处在恢复期。
顾客:那可以刷卡吗?
客服:陈先生,对不起,请您付现款。
顾客:你们不是可以刷卡的吗?
客服:一般是可以的,但是您的信用卡已经刷爆了,您现在还欠银行4807元,而且还不包括您的房贷利息。
顾客:那我先去附近的提款机提款。
客服:陈先生,根据您的记录,您已经超过今日提款限额了。
顾客:算了,你们直接把比萨送到我家吧,家里有现金,多久可以送到。
客服:大约30分钟,如果您不想等,可以自己骑摩托车来取。
顾客:为什么?
客服:根据我们CRM全球定位系统车辆行驶自动跟踪记录显示,你登记的一辆车号为SB-748的摩托车,目前正在解放路东段华联商场右侧行驶,离我们店只有50米。
顾客:好吧(头开始晕)。
客服:陈先生,建议您再带一小份海鲜比萨。
顾客:为什么?你不是说我不能吃吗?
客服:根据我们CRM通讯系统的分析,今天您与一位女性通话频率高、时间长,今天又是2.14,我们分析应该是您的情人,而这位手机用户近来一直买的是海鲜比萨,她应该喜欢这种口味。
顾客:……感到震惊,无言以对。
客服:您最好现在就把比萨送回家,否则您就不方便出来了。
顾客:为什么?
客服:根据我们的定位系统,您的爱人大约30分钟后到家。
顾客:我为什么要出来?客服:您已在汇峰酒店定了今晚的房间,估计您是与情人约会吧。
顾客:听后当即晕倒……
这就是大数据!由此可见,每个人在大数据的面前,相当于一丝不挂,已脱得干干净净。所以未来人人都应很守规则,因为在大数据面前这才是正路,否则您没路可走。
什么是深度学习?
2006年杰弗里·希尔顿等人提出“深度学习”(Deeplearning)概念。什么是深度学习?其实,它是机器学习这门学科的一个分支,属于无监督学习的一种。
从根本上说,深度学习和所有机器学习方法一样,是一种用数学模型对真实世界中的特定问题进行建模,以解决该领域内相似问题的过程。
深度学习的实质,就是通过构建机器学习模型和海量训练数据来逐层变换特征,以提升分类或预测的准确性。其研究目的在于建立、模拟人脑的神经网络,并模仿人脑的机制来解释如图像、声音和文本之类的数据。
深度学习之所以被称为“深度”,是相对浅层学习方法而言的。通过深度学习所掌握的各种模型中,以非线性操作的层级数居多。浅层学习是依靠人工经验抽取样本特征,这样的学习,所掌握的只是单层特征。而深度学习则能够将样本的特征在空间内进行交换,自动地学习获得层次化的特征表示,并实现分类和特征的可视化。
深度学习的重点在于深度,什么是深度?机器学习的过程是数据从一个输入端经过节点进入到输出端,其中每一个节点都会有一个相应的算法和得出的数值,当数据最终从输出端输出后,这一整条路径就构成了一个函数,也可以看作一个分类区间。而深度学习比机器学习更着重纵向传输,也就是在某一个节点进行深度计算,找到从一个输入点到输出点的最长路径,这正是它与其他计算方法找捷径有所不同的地方。
简单地说,深度学习就是把计算机要学习的东西看成一大堆数据,把这些数据丢进一个复杂的、包含多个层级的数据处理网络(深度神经网络),然后检查经过这个网络处理得到的结果数据是不是符合要求,如果符合,就保留这个网络作为目标模型,如果不符合,就一次次地调整网络的参数设置,直到输出满足要求为止。
互联网将全世界连接到了一起,与此同时,也让海量的数据连接到了一起,而深度学习正是依托这些海量数据实现自我寻找特征量,建立新的学习模型。
深度学习引领着“大数据+深度模型”时代的来临,推动着人工智能和人机交互向前快速发展,成为人工智能象人脑一样处理数据的关键技术。
什么是人工神经网络?
通过对人脑神经元网络的抽象化模拟,研究人员利用各类物理元件组成了一套新的网络模型,这样一套通过特殊设计之后能够进行数据处理的网络模型,被称为“人工神经网络”或者“类神经网络”。人工神经网络的诞生和生物学以及高等数学有着密不可分的关联,而要正确认识它的基本原理,就必须从这两个方面入手。
首先从生物角度方面来说,人的行为举止都是由大脑掌控的,在感知到外来元素的刺激之后,感觉器官会将这些信息通过输入神经将信息传递给大脑,再由大脑做出反应命令,通过输出神经递送出去,使相关肢体产生动作。可见,人脑处理事务的过程是一个“机械化”的流程,而人工神经网络模型也正是依据这个蓝本设定出来的。在人工神经网络中,计算机中枢处理装置对应的是“人脑”;各类突触装置代替的是感觉和执行器官;神经元和数据传输系统则与人脑的输入输出神经类似。此外,设计者还需要为这些神经元设定特殊的输出函数,通过这个函数的加权限制,来保证数据的正确传递。
其次,从数学角度来说,人工神经网络在函数映射的掌控下,能够顺利地模拟出人脑信号的传递过程。
为了确保数据能够正常传输,科学家还为人工神经网络引入了“偏置”这一概念。生物学领域认为,在没有得到足够生物电脉冲激活之时,神经元是处于一种类似休眠的状态,信息的传递也会因此受阻。所以,只有生物电超出相关神经元的休眠阈值,生物电脉冲激活休眠神经元系统,信息才能进行传导。在这里,“偏置”的引入,就是为了补正对应神经元的阈值,使得传导信号有效传递而产生的。在这里,我们可以将“偏置”看作整个神经网络链条上的钥匙,它的存在可以激活受抑神经元,确保相关信息的顺利传递。
总体而言,人工神经网络是现代科学的产物,它的研制与生物科学、高等数学以及计算机应用科学密不可分。从理论上来说,人工神经网络模型的拟定,与生物脑体工作机制是一致的,只不过生物体的触觉器官被智能突触代替、生物神经元等传输系统被人造神经节点代替,大脑核心被高级电脑代替罢了。
什么是云计算?
随着互联网时代信息与数据的快速增长,科学、工程和商业计算领域需要处理大规模、海量的数据,对计算能力的需求远远超出自身IT架构的计算能力,这时就需要不断加大系统硬件投入来实现系统的可扩展性。另外,由于传统并行编程模型的局限性,客观上要求一种容易学习、使用、部署的新的并行编程框架。在这种情况下,为了节省成本和实现系统的可扩展性,于是提出了“云计算”(Cloua computing)这个概念,这是新提出的一种商业计算模型,是分布式计算、并行计算和网络计算的发展。
云计算的基本思想是通过构建大规模的基于集群系统的数据中心,将集群系统中的资源(例如硬件、开发平台等)以虚拟化的形式向用户提供资源池。这些虚拟资源可以按需进行动态部署和配置,以优化资源的利用率。
云计算又分为狭义云计算和广义云计算两类。
狭义云计算指基于IT基础设施上进行使用和交付,并通过按需、易扩展的方法从网络上获取目标资源(平台、硬件和软件)。在狭义云计算概念中,“云”是指供给资源的网络,在使用者看来,其中所提供的资源是能够无限扩展,随时获取的。使用者在具体的使用过程中可以按需使用和随时扩展,并按照使用情况进行付费。
广义云计算在满足服务条件的基础上进行使用和交付,并通过按需、易扩展的方式对所需服务进行获取,此类服务既可以是和IT有关的服务,也可以是其他形式的服务。
总之,我们可以将云计算中的“云”理解为很大的规模。而云计算是在并行分布式计算技术基础上的更高层次的“集中式”计算处理模式。因此,在存储管理、数据管理、虚拟化技术、大规模并行任务调度,以及面向数据密集型计算的并行编程模型等技术构成了支撑云计算的关键技术。
因此,云计算实际上是一种处理大规模密集型数据的并行分布式计算技术。云计算的终端用户无需关心分布式并行处理系统方面的细节,就可以直接享受云计算的各种服务。
什么是物联网?
物联网是指利用各种信息传感设备,如射频识别装置、无线传感器、红外感应器、全球定位系统、激光扫描器等对现有物品信息进行感知、采集,通过网络支撑的可靠传输技术,将各种物品的信息汇入互联网,并进入基本海量信息资源的智能决策、安全保障及管理技术与服务的全球公共信息综合服务平台。
物联网有两层意思:第一,物联网的核心和基础仍然是互联网,是在互联网基础上延伸和扩展的网络;第二,其用户端延伸和扩展到任何物品,以及物品之间进行信息交换和通信。因此,物联网是指运用传感器、射频识别、智能嵌入式等技术,使信息传感设备感知任何需要的信息,按照约定的协议,通过可能的网络(如基于WiFi的无线局域网、3G/4G等)接入方式,把任何物体与互联网相连接,进行信息交换通信,在进行物与物、物与人的泛在连接的基础上,实现对物体的智能化识别、定位、跟踪、控制和管理。
物联网作为新一代信息技术的重要组成部分,有三个方面的特征:首先,物联网技术具有互联网特征,对需要用物联网技术联网的物体来说,一定要有能够实现互联互通的互联网络来支撑;其次,物联网技术具有识别与通信特征,接入联网的物体一定要具备自动识别的功能和物物通信的功能;最后,物联网技术具有智能化特征,使用物联网技术形成的网络应该具有自动化、自我反馈和智能控制的功能。