当前位置: 首页 > news >正文

Class62 优化算法

Class62 优化算法

在这里插入图片描述

优化算法
在给定的目标函数下,寻找一组参数,使目标函数的值达到最优(最大化或最小化)

局部最小vs全局最小
在这里插入图片描述
在这里插入图片描述
突集
在这里插入图片描述
也就是说,取集合中的两点𝑥和 𝑦,连成一条线段,这条线段的每一点都在集合𝐶内。
在这里插入图片描述
在这里插入图片描述
凸函数优化

在这里插入图片描述
在这里插入图片描述
梯度下降
找到能 最小化目标函数(损失函数) 的参数

在这里插入图片描述
随机梯度下降
每次更新参数,只用一个样本来计算梯度

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
小批量随机梯度下降

小批量随机梯度下降是介于批量梯度下降(Batch GD)和 随机梯度下降(SGD)之间的一种折中方法

每次更新用全部数据计算梯度,每次更新只用一个样本

在这里插入图片描述
冲量法

不仅仅看当前的梯度,还要“记住”之前的更新方向,给参数增加“惯性”,像物体运动中的冲量一样,继续往前冲一段

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
Adam法
Adam就是结合了Momentum和RMSProp的优点:

1.动量:累积一阶梯度,平滑更新方向。

2.自适应学习率:根据梯度平方调整每个参数的步长

Adam 的核心思想

1.一阶矩(均值,momentum 部分)

在这里插入图片描述
类似动量法,对梯度做指数加权平均

2.二阶矩(平方的均值,RMSProp 部分)

在这里插入图片描述
对梯度平方做指数加权平均,估计方差

3.偏差修正

在这里插入图片描述

4.参数更新

在这里插入图片描述
在这里插入图片描述

http://www.dtcms.com/a/391381.html

相关文章:

  • 电气专业科研怎么入门?电气仿真入门秘籍
  • 软考-系统架构设计师 基于构件的软件工程详细讲解
  • MCP 项目标准管理工具 v1.1.0 发布:新增 API 调试功能,助力 AI 辅助开发标准化
  • Linear Algebra in Competitive Programming
  • Decision Trees vs Neural Networks|决策树 vs 神经网络
  • FreeRTOS——任务管理
  • MSXML4.0是什么?下载安装+常见错误修复一网打尽
  • Claude Code生态
  • Node v22.19 Nest.js 安装 better-sqlite3
  • Android compose Room Sqlite 应用 (注入式)
  • 缓存穿透+缓存雪崩+缓存击穿(解决方法+实战)
  • Docker技术相对于虚拟机技术的优劣势对比!
  • MyBatis框架与参数详解
  • Confluent-Kafka-go 发布超过 1M 消息失败问题解决
  • 数字图像处理-函数矩阵
  • 基于 ST-Link 和 MDK-Keil 的 STM32 程序下载实验
  • 安防监控系统的架构与组成原理
  • 【前端】【threeJs】前端事件偏移问题完整总结
  • web:ts的类型兼容性
  • 黑盒测试:测试用例设计之场景法(流程图法)(模拟用户实际使用软件的场景来设计测试用例,适用于业务流程复杂的系统测试)基本流、备选流
  • Django + Vue3 前后端分离技术实现自动化测试平台从零到有系列 <第二章> 之 平台功能架构整理
  • 神经网络学习笔记14——高效卷积神经网络架构EfficientNet
  • Flutter实现滑动页面停留吸附
  • 【Linux】基本指令介绍
  • 爬虫逆向--Day22Day23--核心实战案例【荔枝网】【WASM学习】----待完成
  • 【软考-系统架构设计师】特定领域软件体系结构(DSSA)
  • idea git使用提示问题处理
  • 数据结构初阶——哈希表的实现(C++)
  • Problem: lab-week3- exercise01 Insertion sort
  • 金融级虚拟机安全:虚拟化平台5大安全风险与国产化防护实践