当前位置：首页 > news >正文

机器学习概述（一）

news 2025/8/15 11:11:57

一、机器学习概述

定义：机器学习是通过大量经验数据来完成特定任务，并通过分析这些数据来优化任务完成效果的过程。
案例：2016年阿尔法围棋战胜韩国围棋九段棋手李世石，展示了机器学习在复杂任务中的强大能力。

二、机器学习应用领域

图像识别、自然语言处理、推荐系统、医疗诊断、金融风险预测等。

三、机器学习基本术语

数据集：数据记录的集合。
样本：数据集中每条记录，描述一个事件或对象。
特征（属性）：反映事件或对象在某方面的表现或性质。
属性空间：属性张成的空间，也称样本空间。
向量表示：样本在属性空间中的表示，每个样本是一个向量。
训练集：用于训练模型的数据集合，包含标记信息。
测试集：用于测试模型的数据集合。

四、监督学习与无监督学习

监督学习：利用已知类别的样本调整分类器参数，数据集包含“正确答案”。
- 分类：输出结果为离散型数值。
- 回归：输出结果为连续型数值。
无监督学习：提供数据集合但不提供标记信息，如聚类算法。
集成学习：通过构建并结合多个学习器来完成学习任务。

五、模型评估与选择

错误率：分类错误的样本数占总样本数的比例。
精度：1 - 错误率。
残差：实际预测输出与真实输出之间的差异。
训练误差：学习器在训练集上的误差。
泛化误差：学习器在新样本上的误差。
损失函数：衡量模型预测误差的大小。
欠拟合：模型未能很好地捕捉数据特征。
原因
- 模型复杂度过低：模型过于简单，无法捕捉数据中的复杂关系。例如，用线性模型去拟合非线性数据。
- 特征不足：输入的特征太少，或者特征与目标变量的相关性不强，导致模型无法学习到有效的规律。
- 训练时间不足：模型没有足够的时间学习数据中的规律。
过拟合：模型对训练数据学习过度，泛化能力差。
原因
- 模型复杂度过高：模型过于复杂，能够完美拟合训练数据中的每一个点，包括噪声。
- 训练数据不足：模型没有足够的数据来学习通用的规律，只能记住训练数据的细节。
- 特征过多：输入的特征过多，其中一些特征可能只是噪声，模型会学习到这些噪声特征。
处理方法：
- 过拟合：增加训练数据、降维、正则化、集成学习。
- 欠拟合：添加新特征、增加模型复杂度、减小正则化系数。

六、模型选择原则

奥卡姆剃刀原理：选择简单有效的模型。
没有免费的午餐定理：不存在对所有问题都有效的算法，算法的优劣需要针对具体问题。

七、模型评估方法

留出法：将数据集划分为训练集和测试集，通常比例为70%、30%。
交叉验证法：将数据集划分为k个子集，每次用k-1个子集作为训练集，剩下的一个子集作为测试集，进行k次训练和测试，返回k个测试结果的均值。
性能指标：
- TP（真正例）：将正类预测为正类的数量。
- FP（假正例）：将反类预测为正类的数量。
- TN（真反例）：将反类预测为反类的数量。
- FN（假反例）：将正类预测为反类的数量。
- 查准率（P）：TP / (TP + FP)。
- 查全率（R）：TP / (TP + FN)。
P-R 图：直观显示学习器的查全率和查准率，用于比较学习器性能。

八、总结

为机器学习的入门提供了全面的概述，涵盖了从基本概念到模型评估的各个方面。通过具体的例子和图表，可以快速掌握机器学习的核心思想和方法。

http://www.dtcms.com/a/331718.html

相关文章：

Spring Cloud系列—Alibaba Sentinel熔断降级

第一章随机事件与概率

前端性能优化移动端网页滚动卡顿与掉帧问题实战

前端开发常见问题及解决方案全解析

解剖HashMap的put流程＜一＞（JDK 1.8）

22.Linux samba服务

USB 3.0 link command 定义

知识的本质

数域筛法GNFS---C语言实现

20道CSS相关前端面试题及答案

Elasticsearch：如何使用 Qwen3 来做向量搜索

css中container和media的用法和区别

SRWare Iron：隐私保护与高效浏览的完美结合

C++ mutex的实现源码分析

Xsens动作捕捉与AI驱动人形机器人训练革新

WVP和ZLM部署与接入NVR指南环境准备

【React】hooks 中的闭包陷阱

三轴云台之脉宽调制技术篇

Qt基本槽

链游（GameFi）开发破局：如何平衡可玩性与经济模型可持续性？

GraphRAG：AI理解复杂知识的未知领域，开启探索之旅

《Python函数：从入门到精通，一文掌握函数编程精髓》

MySQL主从原理

Linux 文件系统简介

解析 TrueType/OpenType 格式的可变字体（Variable Font），提取其所有命名实例（Named Instances）的名称信息

ESP32S3的LVGL配置参数解释、动画播放优化（更新中）

4.1vue3的setup()

《WebGL中FBO的底层运行逻辑》

编程与数学 02-017 Python 面向对象编程 01课题、面向对象

【会员专享数据】2000-2024年我国乡镇的逐日PM₁₀数据（Shp/Excel格式）