理论教育 机器学习分类技术简介

机器学习分类技术简介

更新时间:2025-09-03 理论教育 版权反馈
【摘要】:机器学习试图通过对已有的训练数据集进行分析,并通过降低在训练集上的预测错误率来估计模型中的未知参数。图1.2机器学习的分类1.有监督机器学习在有监督机器学习中,由“教师”提供训练数据以及与这些数据相应的类别标签,算法通过分析这些数据样本,从而习得模型参数(函数)。图1.3有监督机器学习2.无监督机器学习在无监督机器学习中,并没有一个明确的“教师”来给出数据集的标签。

广义上来讲,任何从训练数据中获得信息的模型都需要进行机器学习。由于几乎所有实用或者是有意义的机器学习问题都具有一定的难度,无法提前预知模型的结果,因此研究者将花费大量的时间用来设计如何进行机器学习。机器学习试图通过对已有的训练数据集进行分析,并通过降低在训练集上的预测错误率来估计模型中的未知参数。目前的机器学习方法主要可以分为有监督机器学习、无监督机器学习和强化学习(RL)三类。如图1.2所示。

图1.2 机器学习的分类

1.有监督机器学习

在有监督机器学习中,由“教师”提供训练数据以及与这些数据相应的类别标签,算法通过分析这些数据样本,从而习得模型参数(函数)。当新的数据到来时,可以根据这个函数预测结果。简单来说,就像是有标准答案的练习题。在学习和做题的过程中,可以对照答案,分析问题找出解决方法。在高考题没有给出答案的时候,也可以对题目的答案做出合理的预测,这就是监督学习(supervised learning)。

在有监督机器学习中,可以将较典型的问题分为:将输入变量与输出变量均为连续变量的预测问题称为回归问题,将输出变量为有限个离散变量的预测问题称为分类问题,将输入变量与输出变量均为变量序列的预测问题称为标注问题。如图1.3所示。

图1.3 有监督机器学习

2.无监督机器学习(https://www.daowen.com)

在无监督机器学习中,并没有一个明确的“教师”来给出数据集的标签。样本数据类别未知,需要根据样本之间的相似性或者联系来揭示数据的内容性质及规律,为进一步的数据分析提供基础。在此类机器学习任务中,使用最多、最广的方法是对样本集进行聚类(clustering),将具有相似特征的样本聚集在一起,试图将类内差距最小化、类间差距最大化。比如,对于一系列没有答案的模拟试题,也就是没有参照是对还是错,但是我们还是可以根据这些问题之间的联系将语文、数学、英语分开,这个过程就叫作聚类。在只有特征、没有标签的训练数据集中,通过数据之间的内在联系和相似性将它们分成若干类。如图1.4所示。

图1.4 无监督机器学习

3.强化学习

强化学习是与有监督机器学习和无监督机器学习并列的第三种机器学习范式。其强调如何基于环境而行动,以取得最大化的预期利益。其灵感来源于心理学中的行为主义理论,即有机体如何在环境给予的奖励或惩罚的刺激下,逐步形成对刺激的预期,产生能获得最大利益的习惯性行为。强化学习也是使用没有标签的数据,但是可以通过一些方法知道你是离正确答案越来越近还是离正确答案越来越远(奖惩函数)。可以把奖惩函数看作正确答案的一个延迟、稀疏的反馈形式,并且只会提示是离正确答案越来越近还是离正确答案越来越远。如图1.5所示。

图1.5 强化学习

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈