6.3 多模态数据的机器学习分析

6.3 多模态数据的机器学习分析

目前对于机器学习(machine learning,ML)、深度学习(deep learning)、人工智能(artificial intelligence,AI)的概念常常容易混淆,大多数人认为这些概念是相同的,听到“AI”,便会直接联想到机器学习,反之亦然。然而,这些术语彼此相关,但并不相同。

机器学习:在介绍机器学习之前,我们先来介绍另一个概念即数据挖掘(datamining)。数据挖掘指从一个大的预先存在的数据集中提取新信息的技术。那么很容易理解,机器学习做了相同的事。事实上,机器学习是一种解析数据的技术,从数据中学习并应用所学知识做出明智的决策。许多大公司使用机器学习给用户提供更好的体验,如亚马逊公司使用机器学习,基于用户偏好给用户推荐更好的产品,网飞公司(Netflix)使用机器学习给用户推荐他们想看的电视剧、电影和综艺。

深度学习:深度学习实际上是机器学习的一个子集。从技术上讲其属于机器学习,并且通过相同的方式起作用,但是它有不同的能力。如果一个机器学习模型返回一个错误预测值,那么程序员需要明确问题出在哪里并予以解决,但深度学习中模型自身便可以完成这个步骤,自动汽车驾驶系统便是深度学习的一个很好的例子。

举例来理解一下机器学习和深度学习。假定我们有一个手电筒,然后我们教给一个机器学习模型。无论何时某人说“好黑”的时候,手电筒就会打开。现在这个机器学习模型会分析人们说的不同短语,然后寻找短语“好黑”,当这个短语出现的时候,手电筒就会打开。但是如果某人说“灯光好暗,我看不清东西”,这里使用者想要手电筒打开,但是句子中不包含单词“好黑”,所以手电筒不会打开。如果是一个深度学习模型,它会从自己的计算方法中学习,从而打开手电筒。这就是深度学习和机器学习的区别。

人工智能:AI和机器学习、深度学习则完全不同。AI没有固定的定义,在不同的应用场景你会看到不同的定义,但是这里有一个定义,会让你明白AI实际上是什么。“AI是计算机程序像人脑一样运作的能力”。AI意味着复制人脑,包括人脑思考、工作的方式。事实是目前我们还不能够实现一个真正的AI,但是我们离实现它已经非常接近了。我们还不能实现AI的原因是还不完全了解人脑的很多方面,比如为什么会做梦等。机器学习和深度学习都是实现AI的一种方式,通过使用机器学习和深度学习我们可能在未来实现AI。

尽管有许多细微的差别,机器学习方法通常分为监督和无监督两类学习算法。在监督学习(supervised learning)算法中,人们寻求开发一种函数,该函数通过迭代过程将两组或更多组观察结果与两个或多个运算符定义的类别进行映射,该迭代过程逐渐减少预测结果与预期结果之间的差异。随后,该算法可用于以给定的准确率将新的、先前未见过的数据分配给预定义的类别之一。相比之下,在无监督学习中,人们试图确定如何在没有运营商提供的先验信息的情况下组织数据,组织数据的主要目标是发现数据中未知但可能有用的结构。在监督学习中,用数据集D={x,y}的输入特征x和标签对y建立模型。根据学习任务,y可以采取多种形式,在分类设置中y通常是表示类标签的标量,而在回归的情况下可以是连续变量的向量。当人们试图学习分割模型时,y甚至可以是多维标签图像。监督训练通常相当于找到模型参数θ来根据损失函数L(y,y)最好地预测数据。这里,y表示通过将数据点x传递到代表模型的函数f(x;θ)而获得模型的输出。监督模式识别算法的一种特定形式是用于分类,也就是数据中规则性的自动发现,可将其用于将数据分类为不同的预定义类别。使用这种方法,个体(如他们的脑部扫描)被称为“例子”和它们可能属于的类别“标签”,目的是生成决策函数或“分类器”,它可以最准确地捕获每个实例与其各自标签之间的关系。

无监督学习算法在没有标签的情况下处理数据,并且经过训练找到模式,如潜在子空间。传统的无监督学习算法的示例是主成分分析和聚类方法。无监督训练可以在许多不同的损失函数下执行。一个例子是重建损失L(x,x),其中模型必须学习重建其输入,通常通过较低维或噪声的表示。