当前位置: 首页 > news >正文

小杰机器学习(two)——导数、损失函数、斜率极值最值、微分规则、切平面与偏导数、梯度。

1.求导法则

(1)在机器学习中微积分的作用

        在机器学习和深度学习中,需要衡量预测的结果和实际结果的一个差异,使用一个叫损失函数的数学打分器比对。损失函数越小,表示结果预测的准;损失函数越大表示结果预测的不准。

        比如,如果我们预测明天下雨的概率是80%,但实际上明天是晴天,那么我们的预测就不准,损失函数的值就会比较高。反之,如果我们预测明天下雨的概率是5%,而明天确实是晴天,虽然我们还是预测错了,但相对来说,我们预测得“更接近”实际情况,所以损失函数的值就会低一些。

        损失函数在机器学习和深度学习中非常重要,因为它指导着模型的学习过程,让模型知道应该如何调整自己的参数,以便更好地预测未来的结果。

        在机器学习或者深度学习中,绝大部分任务是构建一个损失函数,然后使其最小化,这个优化的过程就是微分。

以上过程在后面学习的框架中可以自动计算,但是背后的数学原理还是需要简单学习的。

(2)导数

【例子1】小车在马路上匀速前进,一共900m,小车走了30s。

在17.5秒时,小车的速度多快?

答案:900/30=30m/s

【例子2】小车在马路上非匀速前进,一共900m,小车走了30s。

右表表示每间隔5s测一次数据。

在17.5秒时,小车的速度多快?

答案:(725-440)/(20-15) = 57m/s

把多个时间点细分,例如15-20秒,每秒测一次。

在17.5秒时,小车的速度多快?

答案:(629-571)/(18-17) = 58m/s

通过上面的计算可以得到结论,测速的间隔越小,速度越精准。

此时如果把时间间隔趋向于无穷小,就可以使速度结果无限趋向于真实值。

         速度的值,实际上就是所在点的切线斜率

        速度 = 瞬时变化率

        拉格朗日表示法:

        莱布尼茨表示法:

        导数是函数,如果把上图中每个点的斜率都用一个函数表示,这个函数就是“导函数”,通常叫为“导数”。

        导函数表示的切线集合可以描述:

  • 函数的整体变化趋势
  • 也可以表示部分的变化趋势
  • 还可以表示某个点的变化趋势

(3) 斜率的极值和最值

【例子】还是刚才的小车,但是小车学会了倒车。

Q1:哪里的速度为0?

A1:斜率为0的点表示速度为0。

Q2:哪里的距离起点最近/最远?

A2:最远或最近的点斜率都为0。

        如果上面的图像是损失函数,那么斜率为0的点可能就是损失函数最小值或最大值。

极小值/极大值:局部范围的极值。

最小值/最大值:全局的极值。

这些内容是以后机器学习梯度下降的重要思想。

(4)常见的导数

        ① 常数

结论:

        ② 线性函数

结论:

        ③ 二次方程

结论:

        ④ 其他函数

        ⑤不可微函数

        如果一个点存在导数,那么该点的函数会被该点微分。也就是说如果要使函数在整个区间内保持微分,则表示区间中每个点都必须存在导数。

        实际上,并不是所有的函数在每个点都能找到导数,这样的函数就是不可微函数,例如:

在(0,0)点有无数个切线,所以此点不能求导,这个函数就是不可微函数。

再例如

在(0,0)点切线与y轴重合,表示无穷大,无法求导,此函数也是不可微函数。

(5)导数的性质(微分规则)

        ①乘以标量

已知,那么的导数是多少?

答案:

        ② 加和法则

        绿色为人在船上奔跑的时间和距离,蓝色为船离开码头的时间和距离,红色为人相对码头的时间和距离。

结论:

人距离码头的距离 = 船离开码头的距离+人奔跑的距离

人相对码头的速度 = 船相对码头的速度+人相对于船的速度

        ③乘法法则

第一个函数是g(x),第二个函数是h(x),f(x)=g(x)h(x),求f'(x)

答案:

        ④ 链式法则

        链式法则(Chain Rule)是微积分中用于求复合函数导数的一个基本法则。如果你有一个复合函数,比如,其中y 是 x的函数,g(x)是内函数,f是外函数,那么链式法则允许你分别求出外函数和内函数的导数,然后将它们相乘来求复合函数的导数。

        具体来说,链式法则可以表述为:

        这里的是外函数f对内函数g(x)的导数,而是内函数g(x)对自变量x的导数。

【例子】

假设有一个复合函数,求这个函数对x的导数?

解:

1. 确定内函数和外函数

内函数:

外函数:

2. 分别求导

外函数对内函数的导数:

内函数对x的导数:

3. 应用链式法则

(6) 切平面与偏导数

        ①输入和输出的数量

之前函数都是一个输入和输出,现在可以拓展到两个输入和一个输出。

        ②偏导数

        如果把输入的x和y其中一个看做是常数,此时导数就相当于之前的平面导数了,即一个输入的导数。

例如当y=4时,可以求出上图中的曲线的偏导数:

以上过程就是求偏导的过程,同样也可以让x等于常数,同样可以求偏导。

(8)梯度

可以认为梯度是偏导数的集合。

为例,说明梯度的概念。


文章转载自:

http://9znF58fP.Lsjgh.cn
http://zsV9NoH0.Lsjgh.cn
http://HumBShXP.Lsjgh.cn
http://DPfQppSU.Lsjgh.cn
http://NwFUBtuS.Lsjgh.cn
http://AGS95XDc.Lsjgh.cn
http://K2MVOedU.Lsjgh.cn
http://DEEQ1CI0.Lsjgh.cn
http://M00yfYmg.Lsjgh.cn
http://pTciMmII.Lsjgh.cn
http://h0W7azep.Lsjgh.cn
http://ArEHwH1j.Lsjgh.cn
http://EOKnGptz.Lsjgh.cn
http://9Wj4qwdZ.Lsjgh.cn
http://owzSPtIV.Lsjgh.cn
http://GuKZc9KR.Lsjgh.cn
http://3q9MaSDP.Lsjgh.cn
http://MwlAKd7p.Lsjgh.cn
http://JyFVNYCy.Lsjgh.cn
http://X3HmZETa.Lsjgh.cn
http://S9TpXChy.Lsjgh.cn
http://tOHLrSiE.Lsjgh.cn
http://uv5EYI4V.Lsjgh.cn
http://ssJgb9r9.Lsjgh.cn
http://uKegxhel.Lsjgh.cn
http://hmKE9grv.Lsjgh.cn
http://QQ0kilML.Lsjgh.cn
http://5rKxd7lO.Lsjgh.cn
http://0FIKFs26.Lsjgh.cn
http://WINRBIPS.Lsjgh.cn
http://www.dtcms.com/a/370337.html

相关文章:

  • MATLAB R2025a安装配置及使用教程(超详细保姆级教程)
  • Linux/UNIX系统编程手册笔记:POSIX
  • 8.FC平台模块梳理
  • 对接gemini-2.5-flash-image-preview教程
  • ModelScope概述与实战
  • 【Bluedroid】A2dp Source播放流程源码分析(7):蓝牙音频流启动流程深度解析(btif_av_stream_start)
  • Docker 本地开发环境搭建(MySQL5.7 + Redis7 + Nginx + 达梦8)- Windows11 版 2.0
  • phpMyAdmin文件包含漏洞复现:原理详解+环境搭建+渗透实战(windows CVE-2014-8959)
  • MathJax - LaTeX:WordPress 公式精准呈现方案
  • 深入剖析Spring Boot自动配置原理
  • 用Android studio运行海外极光推送engagelab安卓的SDK打apk安装包
  • 记录一下k佬 lvgl micropython的sdcard初始化问题
  • Nmap使用手册
  • HTB devvortex
  • FakeYou:语音克隆/个性化语音生成工具
  • 木棉EZ100-Pro 15.5G矿机参数解析:Etchash算法与高效能耗
  • OpenAI新论文:Why Language Models Hallucinate
  • Compose笔记(四十九)--SwipeToDismiss
  • Coze源码分析-资源库-删除插件-前端源码-核心组件实现
  • 主流的开源协议(MIT,Apache,GPL v2/v3)
  • 计算机原理(二)
  • 算法题(200):最大子段和(动态规划)
  • vue3图标终极方案【npm包推荐】vue3-icon-sui(含源码详解)
  • 当小智 AI 遇上数字人,我用 WebRTC 打造实时音视频应用
  • 后端(JDBC)学习笔记(CLASS 1):基础篇(一)
  • 3分钟快速入门WebSocket
  • ElasticSearch 基础内容深度解析
  • 行为式验证码技术解析:滑块拼图、语序选词与智能无感知
  • CAN总线学习
  • 02.继承MonoBehaviour的单例模式基类