当前位置: 首页 > news >正文

层归一化(Layer Normalization) vs 批量归一化(Batch Normalization)

层归一化和批量归一化都是 归一化方法,目的是让训练更稳定、收敛更快,但应用场景和工作方式大不相同。

名称 一句话解释
BatchNorm 同一通道、不同样本之间 做归一化,适合图像任务,依赖 Batch Size。
LayerNorm 每个样本自身所有特征维度 做归一化,适合序列任务,不依赖 Batch Size。

📦 一、Batch Normalization(批量归一化)

🔧 原理:

在每一层的激活输出上,对同一通道的所有样本进行归一化。

公式(在训练时):
[

http://www.dtcms.com/a/129792.html

相关文章:

  • mysql 有哪些存储引擎、区别是什么
  • 行星际激波在日球层中的传播:Propagation of Interplanetary Shocks in the Heliosphere (第二部分)
  • Maven工具学习使用(十一)——部署项目到仓库
  • 3.4 函数单调性与曲线的凹凸性
  • 欢乐力扣:删除链表的倒数第n个节点
  • vue @import引入CSS scoped无效 造成全局样式污染
  • 【LeetCode 热题100】二叉树遍历入门:从中序遍历到层序与右视图(力扣94 / 102/199)(Go语言版)
  • 【今日三题】小易的升级之路(模拟+gcd) / 礼物的最大价值(动态规划) / 对称之美(字符串哈希)
  • 50道SQL练习题
  • HarmonyOS:Map Kit简介
  • ocr-不动产权识别
  • AI推理强,思维模型也有功劳【57】复利效应
  • 基于 RabbitMQ 优先级队列的订阅推送服务详细设计方案
  • flutter 桌面应用之窗口自定义
  • 【Ubuntu】【树莓派】Linux系统的远程终端登录、远程图形桌面访问、 X图形窗口访问和文件传输操作
  • PHP防火墙代码,防火墙,网站防火墙,WAF防火墙,PHP防火墙大全
  • 程序化广告行业(83/89):行业术语与4A广告代理公司解析
  • idea 2024 build菜单不见了
  • AUTOSAR图解==>AUTOSAR_SWS_TimeSyncOverFlexRay
  • Week 1: Time Complexity, Rectangle Geometry
  • 基于Termux的Android平台C++控制台程序开发指南
  • 速盾:高防CDN的原理和高防IP一样吗?
  • yum的基本操作和vim指令
  • 深翻页问题剖析与解决方案:原理与 Java 实践
  • 链表-算法小结
  • Pytorch深度学习框架60天进阶学习计划 - 第41天:生成对抗网络进阶(一)
  • 《LNMP架构+Nextcloud私有云超维部署:量子级安全与跨域穿透实战》
  • 手动部署内网穿透
  • 有序数组的平方
  • 【云安全】云原生-centos7搭建/安装/部署k8s1.23.6单节点