Day16_【机器学习分类】
重点(有监督学习、无监督学习)、了解(半监督学习、强化学习)
一、有监督学习
定义:输入数据是由特征值和目标值(标签值)组成,输入数据是有标签的
根据目标值(标签值)又分为两类问题:分类问题、回归问题
1、分类问题:目标值是不连续的(不连续:指只能属于一个类别),分类种类有二分类和多分类
2、回归问题:目标值是连续的(连续:指可以变化,通常是数字,代表可以比较大小的量)
二、无监督学习
定义:训练数据没有被标记,即样本 类别未知,没有标签
根据样本间的相似性对样本集进行聚类,发现事物内部结构及相互关系
三、半监督学习
分为主动学习、纯半监督学习和直推学习
- 主动学习:最终利用训练好的模型对新的待测数据进行预测
- 纯半监督学习:最终利用训练好的模型对新的待测数据进行预测
- 直推学习:最终利用训练好的模型对现有的未标记数据进行预测
四、强化学习
奖励激励学习:试错方式学习,决策+回报,即选对了给奖励,选错了会惩罚
四个要素:agent、环境状态、行动、奖励