当前位置：首页 > news >正文

14-机器学习与大模型开发数学教程-第1章 1-6 费马定理与极值判定

news 2025/10/17 7:56:16

在机器学习中，我们常常听到“找到损失函数的最小值”或者“模型在验证集上表现最好”。这里的“最好”其实就是数学中的极值问题。而极值的判定离不开 费马定理（Fermat’s Theorem） 以及随之而来的判别方法。

1. 生活类比：上下坡与停车点

想象你骑自行车上坡，下坡，最终到达山谷或者山顶。

在山顶（极大值点），你的速度一瞬间降为零，再开始下滑。
在山谷（极小值点），你的速度也会归零，然后才开始爬坡。

结论：在极值点，切线斜率通常为 0。
这就是费马定理的核心思想。

2. 费马定理（Fermat’s Theorem）

定理内容：
如果函数 $f (x)$ 在点 $x_0$ 处取得局部极值，且 $f (x)$ 在 $x_0$ 处可导，那么：

$f'(x_0) = 0$

换句话说：

局部极大值点或极小值点的导数必须为 0（或导数不存在）。
但是！导数为 0 不一定就是极值，比如 $f(x) = x^3$ 在 $x = 0$ 处 $f^{'} (0) = 0$ ，但这不是极值点。

3. 几何意义

导数代表切线斜率。

在极大值点：函数先增后减，切线斜率从正变负，必然经过 0。
在极小值点：函数先减后增，切线斜率从负变正，也必然经过 0。

图示说明：上图表示导数变化的过程。函数在导数为零的点，可能成为极大值或极小值的候选点。

4. 极值判定方法

找到候选点 $f^{'} (x) = 0$ 后，我们还要进一步判定：

（1）一阶导数判别法

若 $f^{'} (x)$ 在 $x_0$ 附近由 正 → 负，则 $x_0$ 是极大值。
若 $f^{'} (x)$ 在 $x_0$ 附近由 负 → 正，则 $x_0$ 是极小值。
若符号不变，则不是极值点。

（2）二阶导数判别法

若 $f''(x_0) > 0$ ，函数在此处“开口向上”，则为极小值。
若 $f''(x_0) < 0$ ，函数在此处“开口向下”，则为极大值。
若 $f''(x_0) = 0$ ，判定不了，需要更高阶分析。

5. 例子讲解

例子 1：

$f(x) = x^2$

一阶导： $f^{'} (x) = 2 x$ ，解得候选点 $x = 0$ 。
二阶导： $f^{''} (x) = 2 > 0$ ，所以 $x = 0$ 是极小值点。

例子 2：

$f(x) = -x^2$

一阶导： $f^{'} (x) = - 2 x$ ，解得候选点 $x = 0$ 。
二阶导： $f^{''} (x) = - 2 < 0$ ，所以 $x = 0$ 是极大值点。

6. 在机器学习中的应用

在训练机器学习模型时，我们常常需要 最小化损失函数。

损失函数极小化 就是寻找函数的极小值点。
梯度下降法的核心：

$$

\theta \leftarrow \theta - \eta \cdot \nabla f(\theta)

$$

其中 $∇f(θ)\nabla f(\theta)$ 就是导数/梯度。算法的目标就是找到让导数为 0 的点。

在大模型开发中，比如训练 GPT 这样的模型时：

模型的参数量可能有上亿甚至上千亿。
我们依然遵循相同的原则：通过不断更新参数，让损失函数逼近“极小值点”。
这就是数学上费马定理在 AI 中的直接应用。

7. 小结

费马定理：极值点必定满足导数为零（或不可导）。
极值判定：结合一阶导数符号变化或二阶导数正负来判断。
技术延伸：机器学习优化问题的核心，就是不停地寻找这些极小值点。

所以，下次看到“梯度为零”时，可以立刻联想到：
这背后其实就是费马定理在起作用！

http://www.dtcms.com/a/490973.html

相关文章：

写的网站怎么做接口php在网站上怎么做充值

nginx报400bad request 请求头过大异常处理

react+springboot云上部署

Google 地图类型

免费网站做企业的网站都要准备什么

网站建设往年的高考题免费看电视的网站有哪些

STM32N6 KEIL IDE 调试XIP 应用的一种方法 LAT1575

大模型微调（二）：使微调保持稳定的策略

前端调优23大规则（Part 4)

SpringBoot-入门介绍

如何推动AI技术在企业管理中的商业化落地？

淘宝网站建设的策划书产品软文案例

复制带随机指针的链表

Promise 与 async/await

win11 字体变宽问题

最好的做网站机械加工网站色彩搭配

Pytorch Yolov11目标检测+Android部署留贴记录

iis 发布网站 404archlinux+wordpress

leetcode 2598. 执行操作后的最大 MEX 中等

SuperMap iObject Java实现倾斜数据预处理

逻辑方阵（Logical Square）解说

Vue与React中动态导入的原理及实现差异解析

有一个网站自己做链接获取朋友位置传媒公司属于什么行业类型

服饰类电商网站建设策划昆山vi设计

aben.co微端侧模型价格实惠的服务商

网站开发思维导图内容如何做一个单页面的网站

【Qt】7.信号和槽_connect函数用法（2）

网站的建设流程具体有哪些哪个合肥seo好

大连公司网站建设站点与网站有什么区别

高压混动救援的 “及时雨”：XRC-3363 系列救援充电器实操解析与安全要点