机器学习绪论
1. 机器学习的定义
机器学习(ML)是人工智能的一个分支,研究如何让计算机从数据中自动学习规律,并做出预测或决策,而无需显式编程。
2. 机器学习的主要类型
监督学习(Supervised Learning):输入数据有标签(如分类、回归)。线性回归:拟合连续值(如房价预测)
损失函数:最小二乘法
优化:梯度下降法
逻辑回归:解决二分类问题(如是否患病)
Sigmoid函数输出概率
神经网络:多层感知机(MLP)解决非线性问题
无监督学习(Unsupervised Learning):输入数据无标签(如聚类、降维)。K-Means聚类:自动分组相似数据(如用户分群)
PCA主成分分析:数据降维与可视化
强化学习(Reinforcement Learning):通过试错和奖励机制学习(如游戏AI、自动驾驶)。
3. 基本流程
数据收集 → 2. 数据预处理(清洗、归一化)→ 3. 模型训练 → 4. 评估优化(如准确率、召回率)→ 5. 部署应用
4. 常见算法(举例)
分类:决策树、SVM、神经网络
回归:线性回归、随机森林
聚类:K-Means、DBSCAN