4.1.2 机器学习分类
机器学习算法的任务大致分为监督学习(也称为归纳学习)、无监督学习、半监督学习、强化学习。
1.监督学习
在监督学习中,算法以示例给定输入和产生相应输出的形式呈现,目的是学习将输入映射到输出的一般规则。输入数据称为训练数据,并具有与之关联的已知输出(结果),训练数据指导算法的开发。模型是通过训练过程建立的,在训练过程中,模型会做出预测,当预测不正确时,模型会被修正。训练将继续进行,直到模型在训练数据上达到所需的精度水平。有监督的机器学习算法可以将过去学到的知识应用到新数据中,使用标记的数据示例来预测未来的事件。学习算法还可以将输出与正确的输出进行比较,用以发现任何错误并相应地修改模型。监督学习问题主要有以下形式。
·分类:这是基于训练数据集预测结果,其中输出变量采用不同类别的形式。通过预标记数据的形式输入训练数据来构建模型。分类技术用到的主要模型有:支持向量机、朴素贝叶斯、高斯贝叶斯、k-最近邻(kNN)、逻辑回归。
·回归:回归与分类非常相似,它们之间的唯一区别在于,回归是给定样本的结果,其中输出变量的形式为真实值,如身高、体温和体重。线性回归、多项式回归、支持向量机(SVM)、决策树和神经网络都是回归模型的例子。
·预测:这是根据过去和现在的数据进行预测的方法,也称为时间序列预测。
·集成:这是一种监督学习,它结合了多个不同的机器学习模型来预测新样本的结果。
2.无监督学习
无监督学习和监督学习是相反的,也就是说训练时输入数据是没有标签的。在无监督学习中,因为训练集没有人为标注的结果,所以需要让算法从输入中寻找信息。由于数据未标记,因此无法评估算法输出的结构的准确性,数据可能同时缺少分类和标签。因此,该模型是通过解释开发的,通过在输入数据中发现隐藏的结构和推论。这可能是通过提取规则,利用聚类、降维和关联规则学习等方法减少数据冗余来完成。该算法可能永远得不到正确的输出,而只是对数据的底层结构进行建模。以下定义了三种类型的无监督学习问题:
·关联是发现集合中事情同时出现的概率。这在市场营销和医疗保健中被广泛使用来作出相关决策。例如,如果诊断为肥胖,则意味着患高血压等病症的可能性较高。
·分类是指对元素进行分组,使同一族群中的元素比来自另一族群的元素更相似。
·降维可以通过特征选择和特征提取来实现。降维可以在数学上重新表示或转换数据。特征提取执行从高维空间到低维空间的数据转换。这可能涉及减少数据集的变量,同时保持数据完整性并确保最重要的信息得到保留。
3.半监督学习
半监督学习是监督学习与无监督学习相结合的一种学习方法。半监督学习使用大量的未标记数据,以及同时使用标记数据来进行模式识别工作。当使用半监督学习时,将会要求尽量少的人员来从事标注工作,同时又能够带来比较高的准确性,因此,半监督学习正越来越受到人们的重视。例如,在解决分类和回归问题中,现在很多研究人员开始尝试半监督学习方法。
4.强化学习
强化学习强调了系统与动态环境交互,在动态环境中,代理必须执行特定的目标。强化学习是机器学习、行为心理学、伦理学和信息理论的交叉点。强化学习允许代理基于其当前状态决定下一步的最佳行动,并通过学习使奖励得到最大化的行为。最佳行动(或最佳策略)通常是通过反复试验和反馈来学习的,这允许算法确定上下文中的理想行为。强化学习通常用于机器人技术,例如,机器人可以通过碰撞桌子、椅子等来接收负面反馈来学习避免碰撞,这也涉及计算机视觉技术。强化学习与标准监督学习的不同之处在于,永远不会提供正确的示例,也不会明确纠正次优决策,重点是在现实世界中的表现。与人类学习的方式类似,强化学习假定从自己的经验中学习的行为是理性的,因此有助于理解人类如何从经验中学习,从而作出正确的决定。