当前位置: 首页 > news >正文

【深度学习】反向传播

文章目录

  • 一、为什么要做反向传播?
  • 二、反向传播的作用

一、为什么要做反向传播?

反向传播是深度学习模型能 “学会” 东西的核心环节。

反向传播的步骤如下:

  1. 计算损失函数(Loss(W))对各个参数(权重矩阵中的各个矩阵元素)的梯度(偏导数,因为参数很多很多)。
  2. 根据每个参数的偏导数值,来调整参数,使损失变小(具体调整做法在下面)。

二、反向传播的作用

  • 1.通过链式法则,计算出了偏导数

反向传播通过链式法则,从输出层往输入层回溯,精准算出误差对每个参数的偏导数。

注意,公式右边的计算需要用到输入特征X和预测结果Y,因此在做反向传播之前,要先进行一次前向传播。


  • 2.指导参数调大还是调小,以及调整幅度

梯度值,比如梯度为2,我们要提取两个信息:

  • 正负
  • 大小

梯度为正,参数需减小以降低误差;梯度为负,参数需增大以降低误差。

具体的更新公式为:参数 = 参数 - 学习率 × 梯度。

梯度越大,参数当前对误差影响越大。


http://www.dtcms.com/a/478452.html

相关文章:

  • 网站开发交接新闻源发稿平台
  • 滴答时钟延时
  • 【C++篇】:ServiceBus RPC 分布式服务总线框架项目
  • 后训练——Post-training技术介绍
  • 获取KeyStore的sha256
  • Linux (5)| 入门进阶:Linux 权限管理的基础规则与实践
  • 常见压缩包格式详解:区别及在不同系统中的解压方式
  • 【数学 进制 数位DP】P9362 [ICPC 2022 Xi‘an R] Find Maximum|普及+
  • .net过滤器和缓存
  • 张家港网站建设培训班电力建设专家答疑在哪个网站
  • 零基础学AI大模型之大模型的“幻觉”
  • 网站快速优化排名排名c语言入门自学零基础
  • MySQL排序规则utf8mb4_0900_ai_ci解析
  • 做网站别名解析的目的是什么同城广告发布平台
  • GPT4Free每日更新的免登录工作AI提供商和模型列表
  • 网站群建设座谈会云浮新增病例详情
  • Proxmox 9 一键更新虚拟机mac
  • C# WPF DataGrid使用Observable<Observable<object>类型作为数据源
  • sem网站建设网站是由多个网页组成的吗
  • redis中的数据类型和适用场景
  • 从字节到网页:HTTP 与 TCP 的底层密码全解析
  • 建设局招标办网站百度seo搜索引擎优化厂家
  • 隧道高清晰广播+紧急电话系统的应用
  • Ubuntu使用图片
  • C# 求圆柱体的周长(Find the perimeter of a cylinder)
  • php 网站部署点击网站出现微信二维码的链接怎么做
  • MCU和GPIO (1)
  • STM32H743-ARM例程18-SPI
  • 力扣Hot100--94.二叉树的中序遍历
  • NXP - 用MDK建立基于arm-none-eabi工具链的工程框架