当前位置: 首页 > news >正文

机器学习第八讲:向量/矩阵 → 数据表格的数学表达,如Excel表格转数字阵列

机器学习第八讲:向量/矩阵 → 数据表格的数学表达,如Excel表格转数字阵列

资料取自《零基础学机器学习》。
查看总目录:学习大纲

关于DeepSeek本地部署指南可以看下我之前写的文章:DeepSeek R1本地与线上满血版部署:超详细手把手指南


一、爬山GPS导航仪比喻 🧭(教材第八章引入案例1

类比过程

最陡峭方向
登山者位置
导数≈坡度检测仪
坡度方向
下一步落脚点
重复直到达峰顶/谷底

这个导航过程就是微积分中的「梯度下降」算法原理


二、火箭发射最佳角度解密 🚀

需求场景2:寻找发射角度θ使飞行高度最大
设高度公式:
H ( θ ) = v 2 sin ⁡ 2 θ 2 g H(θ) = \frac{v^2 \sin^2θ}{2g} H(θ)=2gv2sin2θ

求导找极值
① 求导: d H d θ = v 2 sin ⁡ 2 θ g \frac{dH}{dθ} = \frac{v^2 \sin2θ}{g} dθdH=gv2sin2θ
② 令导数为0: sin ⁡ 2 θ = 0 \sin2θ=0 sin2θ=0 θ = 4 5 ∘ θ=45^\circ θ=45

graph LRA[初始角度30°] --> B[导数为正→需增大角度]C[角度50°] --> D[导数为负→需减小角度]B & D --> E[最优解45°]

三、核心运算工具箱 ⚙️

  1. 导数:变化率的显微镜

    # 代码示例:计算函数在x=2处的导数
    def f(x):return 3*x**2 + 2*x +1
    h = 0.0001  # 极微小变化量
    derivative = (f(2+h) - f(2))/h  # 计算结果≈14
    
  2. 梯度下降流程图(教材第八章图例3

随机初始参数
计算当前梯度
梯度接近0?
沿负梯度方向更新参数
输出最优参数

四、AI训练实战模拟 🤖

场景:训练智能秤自动校正误差
损失函数: L ( w ) = ( 真实重量 − w × 感应值 ) 2 L(w) = (真实重量 - w×感应值)^2 L(w)=(真实重量w×感应值)2

梯度下降步骤

  1. 初始化权重w=0.8
  2. 计算梯度: d L d w = − 2 ( 真实值 − w × 感应值 ) × 感应值 \frac{dL}{dw} = -2(真实值 - w×感应值)×感应值 dwdL=2(真实值w×感应值)×感应值
  3. 更新公式: w 新 = w − 学习率 × 梯度 w_{新} = w - 学习率×梯度 w=w学习率×梯度
  4. 重复直到梯度接近于0

五、现实世界优化舞台 🌍

应用领域优化目标微积分工具
电商定价策略利润最大化多元函数偏导数
物流路径规划运输成本最小化路径积分优化
手机自动亮度耗电与舒适度的最佳平衡约束条件极值
疫苗剂量试验效果与副作用平衡点微分方程平稳点

六、常见翻车现场警示 🚧(教材第八章误区4

  1. 步长灾难

    合理步长
    稳定逼近最优点
    过大步长
    震荡发散像青蛙跳
    过小步长
    计算十年还没到终点
  2. 局部最优陷阱
    就像掉进火山口以为到达地球最低点,实际还有马里亚纳海沟

  3. 维度诅咒
    优化手机参数时涉及1000个变量 → 搜索空间比宇宙原子还多


七、高阶技巧补给站 ⛽️

动量加速法(教材第八章进阶内容5):

当前梯度
带动量更新
参数更新=γ×上次更新 + 学习率×梯度
有效减少震荡

应用对比

方法迭代次数收敛效果
基础梯度下降1500次轻微震荡
动量加速法400次平稳快速

八、知识精髓总结 💎

微积分是量化决策的数学引擎,通过动态感知变化趋势引导系统不断逼近全局最优解(教材第八章核心结论1

(典型案例:Tesla自动驾驶系统通过微分方程实时优化行驶轨迹🚗)

目录:总目录
上篇文章:机器学习第七讲:概率统计 → 预测可能性,下雨概率70%就是典型应用
下篇文章:机器学习第九讲:缺失值填补 → 补全问卷漏填的题目,保证数据完整性



  1. 《零基础学机器学习》第八章第一节"最优化本质",P.385 ↩︎ ↩︎

  2. 《零基础学机器学习》第八章案例8-3"航天器参数优化",P.402 ↩︎

  3. 《零基础学机器学习》第八章图8-7梯度下降流程图,P.414 ↩︎

  4. 《零基础学机器学习》第八章"优化算法陷阱",P.427 ↩︎

  5. 《零基础学机器学习》第八章动量加速推导,P.435 ↩︎

相关文章:

  • 数据集-目标检测系列- 杨桃 数据集 Starfruit>> DataBall
  • 深入学习Zookeeper的知识体系
  • KV cache 缓存与量化:加速大型语言模型推理的关键技术
  • RobotxR1:通过闭环强化学习在大语言模型上实现具身机器人智能
  • c++ 基于范围的for循环
  • keepalived+lvs
  • uniapp+vue3+uview来开发我们的项目
  • mysql常用方法
  • 【PostgreSQL数据分析实战:从数据清洗到可视化全流程】金融风控分析案例-10.3 风险指标可视化监控
  • Stapi知识框架
  • 在服务器排查java某个线程导致CPU飙高教程
  • 软件I2C
  • MCP-RAG 服务器:完整设置和使用指南
  • 图片的require问题
  • 前端工程化:从 Webpack 到 Vite
  • React+Webpack 脚手架、前端组件库搭建
  • 华为鸿蒙电脑能否作为开发机?开发非鸿蒙应用?
  • 力扣第156场双周赛
  • Angular | 利用 `ChangeDetectorRef` 解决 Angular 动态显示输入框的聚焦问题
  • linux入门学习(介绍、常用命令、vim、shell)
  • 宝通科技:与宇树合作已签约,四足机器人在工业场景落地是重点商业化项目
  • 人民日报仲音:大力纠治违规吃喝顽瘴痼疾
  • 加拿大新政府宣誓就职
  • 美元指数上涨超1%重返101上方,创1个月新高
  • A股高开高走:沪指涨0.82%,创指涨2.63%,超4100股收涨
  • 佩斯科夫:俄会考虑30天停火提议,但试图对俄施压无用