0-机器学习简介
有监督学习
目标:建立一个模型(函数),来描述输入(x)和输出(y)之间的映射关系。
价值:模型训练完成后,新的输入,模型会给出预测值输出。
- 注意点:
1.要有足够的训练样本
2.输入和输出之间有关联关系
3.输入和输出可以数值化表示
有监督学习的应用
- 文本分类
输入:文本
输出:类别 - 机器翻译
输入:A语言文本
输出:B语言文本 - 图像识别
输入:图像
输出:类别 - 语音识别
输入:音频
输出:文本
无监督学习
目标:提供无标注数据,使用算法对数据分析处理,得到结论
无监督学习的应用
- 聚类
- 降维
- 找特征值
常用概念
- 过拟合
模型失去了泛化能力。模型再训练集和验证集上表现好,在测试集上表现差,一般是过拟合。 - 欠拟合
模型没能在输入和输出之间建立起合理的映射。输入训练集,输出预测与标注结果依然相差很大。 - 评价指标
准确率
召回率
F1值
Topk
总结
机器学习本质:从已知数据中找规律,用来预测未知的样本。
深度学习:是机器学习的一种方法。