4.1.2　机器学习分类

2026年01月16日

版权

4.1.2　机器学习分类

机器学习算法的任务大致分为监督学习（也称为归纳学习）、无监督学习、半监督学习、强化学习。

1.监督学习

在监督学习中，算法以示例给定输入和产生相应输出的形式呈现，目的是学习将输入映射到输出的一般规则。输入数据称为训练数据，并具有与之关联的已知输出（结果），训练数据指导算法的开发。模型是通过训练过程建立的，在训练过程中，模型会做出预测，当预测不正确时，模型会被修正。训练将继续进行，直到模型在训练数据上达到所需的精度水平。有监督的机器学习算法可以将过去学到的知识应用到新数据中，使用标记的数据示例来预测未来的事件。学习算法还可以将输出与正确的输出进行比较，用以发现任何错误并相应地修改模型。监督学习问题主要有以下形式。

·分类：这是基于训练数据集预测结果，其中输出变量采用不同类别的形式。通过预标记数据的形式输入训练数据来构建模型。分类技术用到的主要模型有：支持向量机、朴素贝叶斯、高斯贝叶斯、k-最近邻（kNN）、逻辑回归。

·回归：回归与分类非常相似，它们之间的唯一区别在于，回归是给定样本的结果，其中输出变量的形式为真实值，如身高、体温和体重。线性回归、多项式回归、支持向量机（SVM）、决策树和神经网络都是回归模型的例子。

·预测：这是根据过去和现在的数据进行预测的方法，也称为时间序列预测。

·集成：这是一种监督学习，它结合了多个不同的机器学习模型来预测新样本的结果。

2.无监督学习

无监督学习和监督学习是相反的，也就是说训练时输入数据是没有标签的。在无监督学习中，因为训练集没有人为标注的结果，所以需要让算法从输入中寻找信息。由于数据未标记，因此无法评估算法输出的结构的准确性，数据可能同时缺少分类和标签。因此，该模型是通过解释开发的，通过在输入数据中发现隐藏的结构和推论。这可能是通过提取规则，利用聚类、降维和关联规则学习等方法减少数据冗余来完成。该算法可能永远得不到正确的输出，而只是对数据的底层结构进行建模。以下定义了三种类型的无监督学习问题：

·关联是发现集合中事情同时出现的概率。这在市场营销和医疗保健中被广泛使用来作出相关决策。例如，如果诊断为肥胖，则意味着患高血压等病症的可能性较高。

·分类是指对元素进行分组，使同一族群中的元素比来自另一族群的元素更相似。

·降维可以通过特征选择和特征提取来实现。降维可以在数学上重新表示或转换数据。特征提取执行从高维空间到低维空间的数据转换。这可能涉及减少数据集的变量，同时保持数据完整性并确保最重要的信息得到保留。

3.半监督学习

半监督学习是监督学习与无监督学习相结合的一种学习方法。半监督学习使用大量的未标记数据，以及同时使用标记数据来进行模式识别工作。当使用半监督学习时，将会要求尽量少的人员来从事标注工作，同时又能够带来比较高的准确性，因此，半监督学习正越来越受到人们的重视。例如，在解决分类和回归问题中，现在很多研究人员开始尝试半监督学习方法。

4.强化学习

强化学习强调了系统与动态环境交互，在动态环境中，代理必须执行特定的目标。强化学习是机器学习、行为心理学、伦理学和信息理论的交叉点。强化学习允许代理基于其当前状态决定下一步的最佳行动，并通过学习使奖励得到最大化的行为。最佳行动（或最佳策略）通常是通过反复试验和反馈来学习的，这允许算法确定上下文中的理想行为。强化学习通常用于机器人技术，例如，机器人可以通过碰撞桌子、椅子等来接收负面反馈来学习避免碰撞，这也涉及计算机视觉技术。强化学习与标准监督学习的不同之处在于，永远不会提供正确的示例，也不会明确纠正次优决策，重点是在现实世界中的表现。与人类学习的方式类似，强化学习假定从自己的经验中学习的行为是理性的，因此有助于理解人类如何从经验中学习，从而作出正确的决定。

4.1.2 机器学习分类

4.1.2　机器学习分类