当前位置：首页 > news >正文

深度学习_第二轮

news 2025/8/13 3:13:44

损失函数

对偏置和权重求导，x、y作为常量

确实，当进行模型训练时，(x) 和 (y) 分别代表输入特征和对应的输出值，它们以数据点对的形式存在，一个数据集中通常包含多对这样的数据。每一对 ((x_i), (y_i)) 代表了数据集中的一个样本。在计算损失函数的梯度（即关于权重的偏导数）时，需要考虑整个数据集中的所有样本。

对于每个样本 ((x_i), (y_i))，我们计算其对损失函数的贡献，并通过求和或平均这些贡献来得到整体的损失值及其梯度。这意味着，在实际操作中，虽然在计算单个样本的偏导数时 (x_i) 和 (y_i) 被视为常量，但这一过程会针对数据集中的每一个样本重复执行。

具体来说：

在批量梯度下降中，我们会遍历整个数据集，计算所有样本的平均梯度，然后使用这个平均梯度更新一次权重。
在**随机梯度下降（SGD）**中，每次只用一个样本 ((x_i), (y_i)) 来估计梯度并立即更新权重。
在小批量梯度下降中，则是每次使用一个小批次（mini-batch）的样本，计算这批样本的平均梯度来更新权重。

因此，即使 (x) 和 (y) 在处理每个样本时被视为常量，为了优化模型参数，我们需要遍历数据集中的所有 ((x_i), (y_i)) 对，利用它们提供的信息来指导权重的更新方向。这样，随着迭代次数增加，模型能够逐渐学习到数据中的模式，从而对未见过的数据做出准确预测。

http://www.dtcms.com/a/44221.html

相关文章：

数据结构——布隆过滤器

天锐绿盾软件｜外设管控具体有哪些措施？

正交投影与内积空间：机器学习的几何基础

考研复试问题总结-数据结构（1）

把GB型材库放入solidwork中点击库无法应

HTTP与HTTPS：从原理到实践，深入解析Web通信的奥秘

扬帆启航于数据结构算法之雅舟旅程，悠然漫步于C++秘境——Leetcode刷题之用栈实现队列，用队列实现栈

Vue3 + Vite + TS,使用 Pinia

程序诗篇里的灵动笔触：指针绘就数据的梦幻蓝图（水文，勿三）

通过 python3 指令如何建立虚拟环境的办法

React + TypeScript 实现 SQL 脚本生成全栈实践

数据集笔记：新加坡一些交通的时间序列统计量

不同版本的BLE和WiFi有什么区别？

【MATLAB例程】三维下的IMM（交互式多模型），模型使用CV（匀速）、CT（匀速转弯）和CA（匀加速），滤波使用EKF。附完整代码

LeetCode 每日一题 2025/2/24-2025/3/2

如何把word文档整个文档插入到excel表格里？

内存管理技巧与任务堆栈优化详解（结合六足机器人项目）

火山引擎 DeepSeek R1 API 使用小白教程

从入门到精通：Linux 权限管理（rwx/chmod/chown）

CosyVoice2整合包特殊声音标记,声音克隆更逼真,新增批量生成

ARMv8架构缓存一致性协议同步速度评估

【MySQL】表空间丢失处理（Tablespace is missing for table 错误处理）

Git与GitHub实战指南：从入门到高效协作

GitCode 助力 python-office：开启 Python 自动化办公新生态

为AI聊天工具添加一个知识系统之127 详细设计之68 编程核心技术：Cognitive Protocol Language 之2

【零基础C语言】第三节控制结构

012 rocketmq事务消息

安当全栈式PostgreSQL数据库安全解决方案：透明加密、动态凭据与勒索防护一体化实践

梯度下降法(Gradient Descent) -- 现代机器学习的血液

MySQL零基础教程12—聚合查询（聚合函数）