当前位置: 首页 > news >正文

层归一化(Layer Normalization) vs 批量归一化(Batch Normalization)

层归一化和批量归一化都是 归一化方法,目的是让训练更稳定、收敛更快,但应用场景和工作方式大不相同。

名称 一句话解释
BatchNorm 同一通道、不同样本之间 做归一化,适合图像任务,依赖 Batch Size。
LayerNorm 每个样本自身所有特征维度 做归一化,适合序列任务,不依赖 Batch Size。

📦 一、Batch Normalization(批量归一化)

🔧 原理:

在每一层的激活输出上,对同一通道的所有样本进行归一化。

公式(在训练时):
[

相关文章:

  • mysql 有哪些存储引擎、区别是什么
  • 行星际激波在日球层中的传播:Propagation of Interplanetary Shocks in the Heliosphere (第二部分)
  • Maven工具学习使用(十一)——部署项目到仓库
  • 3.4 函数单调性与曲线的凹凸性
  • 欢乐力扣:删除链表的倒数第n个节点
  • vue @import引入CSS scoped无效 造成全局样式污染
  • 【LeetCode 热题100】二叉树遍历入门:从中序遍历到层序与右视图(力扣94 / 102/199)(Go语言版)
  • 【今日三题】小易的升级之路(模拟+gcd) / 礼物的最大价值(动态规划) / 对称之美(字符串哈希)
  • 50道SQL练习题
  • HarmonyOS:Map Kit简介
  • ocr-不动产权识别
  • AI推理强,思维模型也有功劳【57】复利效应
  • 基于 RabbitMQ 优先级队列的订阅推送服务详细设计方案
  • flutter 桌面应用之窗口自定义
  • 【Ubuntu】【树莓派】Linux系统的远程终端登录、远程图形桌面访问、 X图形窗口访问和文件传输操作
  • PHP防火墙代码,防火墙,网站防火墙,WAF防火墙,PHP防火墙大全
  • 程序化广告行业(83/89):行业术语与4A广告代理公司解析
  • idea 2024 build菜单不见了
  • AUTOSAR图解==>AUTOSAR_SWS_TimeSyncOverFlexRay
  • Week 1: Time Complexity, Rectangle Geometry
  • 2025年上海市工程建设标准国际化工作要点发布
  • 盘中五味和人生五味,北京人艺《天下第一楼》将演第600场
  • 夜读丨永不掉电的陪伴
  • 上海黄浦:新婚夫妻来登记可“摇号”定制无人机表演,每周三对
  • 22国外长联合声明:要求以方立即允许全面恢复对加沙援助
  • 设甜蜜打卡点、还能当婚车,上海定制公交车变身“幸福专列”