机器学习-机器学习模型简介
机器学习算法类型
监督学习
在有标号的数据里进行预测训练
自监督学习(word2vec,BERT)
标号来自数据本身
半监督学习(自训练)
在有标号和无标号的数据里训练,学习模型会预测标号,或推测无标号的数据的标号
无监督学习(clustering,GAN)
在无标号的数据上训练
强化学习
利用与环境交互得到的观察结果采取行动以最大化收益
监督学习(最常见)的组成
模型
根据输入获得输出预测(listing house->sale price)
损失Loss
预测值与真实值之间的差异
(预测价格-真实价格)^2
目标objective
最小化损失函数
优化optimization
将模型中没指定(可以学习)的参数确定下来,使损失最小化
监督学习模型的类型
- 决策树:用树做决策
- 线性模型:根据输入的线性组合做出决定
- 核方法:用核函数计算特征相似度
- 神经网络:用神经网络学习特征表示
总体关系如下所示