当前位置：首页 > news >正文

Class62 优化算法

news 2025/9/20 9:31:10

Class62 优化算法

在这里插入图片描述

优化算法
在给定的目标函数下，寻找一组参数，使目标函数的值达到最优（最大化或最小化）

局部最小vs全局最小
在这里插入图片描述

突集

也就是说，取集合中的两点𝑥和 𝑦，连成一条线段，这条线段的每一点都在集合𝐶内。

凸函数优化

在这里插入图片描述

梯度下降
找到能最小化目标函数（损失函数）的参数

在这里插入图片描述
随机梯度下降
每次更新参数，只用一个样本来计算梯度

在这里插入图片描述

小批量随机梯度下降

小批量随机梯度下降是介于批量梯度下降（Batch GD）和 随机梯度下降（SGD）之间的一种折中方法

每次更新用全部数据计算梯度，每次更新只用一个样本

在这里插入图片描述
冲量法

不仅仅看当前的梯度，还要“记住”之前的更新方向，给参数增加“惯性”，像物体运动中的冲量一样，继续往前冲一段。

在这里插入图片描述

在这里插入图片描述

Adam法
Adam就是结合了Momentum和RMSProp的优点：

1.动量：累积一阶梯度，平滑更新方向。

2.自适应学习率：根据梯度平方调整每个参数的步长

Adam 的核心思想

1.一阶矩（均值，momentum 部分）

在这里插入图片描述
类似动量法，对梯度做指数加权平均

2.二阶矩（平方的均值，RMSProp 部分）

在这里插入图片描述
对梯度平方做指数加权平均，估计方差

3.偏差修正

在这里插入图片描述

4.参数更新

在这里插入图片描述

http://www.dtcms.com/a/391381.html

相关文章：

电气专业科研怎么入门？电气仿真入门秘籍

软考-系统架构设计师基于构件的软件工程详细讲解

MCP 项目标准管理工具 v1.1.0 发布：新增 API 调试功能，助力 AI 辅助开发标准化

Linear Algebra in Competitive Programming

Decision Trees vs Neural Networks｜决策树 vs 神经网络

FreeRTOS——任务管理

MSXML4.0是什么？下载安装+常见错误修复一网打尽

Claude Code生态

Node v22.19 Nest.js 安装 better-sqlite3

Android compose Room Sqlite 应用 (注入式）

缓存穿透+缓存雪崩+缓存击穿（解决方法+实战）

Docker技术相对于虚拟机技术的优劣势对比！

MyBatis框架与参数详解

Confluent-Kafka-go 发布超过 1M 消息失败问题解决

数字图像处理-函数矩阵

基于 ST-Link 和 MDK-Keil 的 STM32 程序下载实验

安防监控系统的架构与组成原理

【前端】【threeJs】前端事件偏移问题完整总结

web：ts的类型兼容性

黑盒测试：测试用例设计之场景法（流程图法）（模拟用户实际使用软件的场景来设计测试用例，适用于业务流程复杂的系统测试）基本流、备选流

Django + Vue3 前后端分离技术实现自动化测试平台从零到有系列＜第二章＞之平台功能架构整理

神经网络学习笔记14——高效卷积神经网络架构EfficientNet

Flutter实现滑动页面停留吸附

【Linux】基本指令介绍

爬虫逆向--Day22Day23--核心实战案例【荔枝网】【WASM学习】----待完成

【软考-系统架构设计师】特定领域软件体系结构（DSSA）

idea git使用提示问题处理

数据结构初阶——哈希表的实现（C++）

Problem: lab-week3- exercise01 Insertion sort

金融级虚拟机安全：虚拟化平台5大安全风险与国产化防护实践