当前位置: 首页 > news >正文

LeakyReLU和ReLU的区别

提示:坚持更新,坚持学习,更多知识还在探索中

文章目录

  • 一、ReLU (Rectified Linear Unit - 整流线性单元)
    • ReLU(整体流性单元)
  • 二、LeakyReLU (带泄露的整流线性单元)
  • 总结


一、ReLU (Rectified Linear Unit - 整流线性单元)

ReLU(整体流性单元)

ReLU是深度学习中最基础、最尝使用的激活函数之一。

  • 数学公式:f(x)= max(0, x)=最大值(0,x)
    简单来说,如果输入x是正数,输出就是x;如果是负数,输出就是0

  • 优点:
    1.计算简单: 只涉及比较和取最大值操作,没有指数、三角函数等复杂运算,速度极快。这是它在深度学习中被广泛采用的关键原因之一。
    2.缓解梯度消失: 在正区间,其导数为 1,能够有效地将梯度原封不动地传递到前层,极大地缓解了深层网络中的梯度消失问题(相对于 Sigmoid 和 Tanh 而言)。
    2.稀疏激活性: 会让一部分神经元的输出为 0,从而使得网络变得稀疏,减少了参数的相互依存关系,缓解过拟合问题。

  • 缺点:
    1.Dead ReLU Problem (神经元死亡问题): 这是 ReLU 最主要的缺陷。如果一个神经元在训练过程中,其权重更新后,对于所有训练数据的输入该神经元的输出都是负数(即落入 ReLU 的左侧完全平坦区域),那么它的梯度将永远为 0。这意味着之后的训练过程中,这个神经元将永远无法被激活,相当于“死亡”了,其权重也不再更新。
    2.非零中心: ReLU 的输出均值恒大于零,这可能会对后续的权重更新造成轻微的影响(需要更仔细地调整学习率等参数)。

二、LeakyReLU (带泄露的整流线性单元)

LeakyReLU 是针对 ReLU 的“Dead ReLU”问题而提出的改进版本。

  • 数学公式:f(x) = max(ax, x)
    这里的a是一个很小的常数(例如0.01或0.1).如果输入的x是正数,输出就是x;如果是负数,输出不再是0,而是a*x(一个很小的负数值)

  • 优点:
    1.解决了“Dead ReLU”问题: 这是其核心优势。因为在负区间梯度不再是 0(而是一个很小的值 α),所以即使神经元输出为负,其梯度也不会完全消失,权重仍然有机会得到更新,神经元有机会“复活”。
    2.保留了 ReLU 的优点: 计算同样简单(只是多了一个乘法操作),在正区间梯度仍然是 1,缓解梯度消失的效果一样好。

  • 缺点:
    1.效果不一致: LeakyReLU 的效果并不总是稳定的,其性能提升在一定程度上依赖于超参数 α 的选择。虽然通常设为 0.01,但这个值并不总是最优的。
    2.引入新超参: 需要手动尝试或通过交叉验证来调整 α 的值,增加了模型设计的复杂度。
    LeakyReLU 还有一个变体叫做 PReLU (Parametric ReLU),它将 α 也作为一个可学习的参数,让网络在训练过程中自己学习出最适合的斜率,这通常能取得比固定 α 更好的效果,但计算量会稍大一些。

在这里插入图片描述

总结

未完待续,,,更多知识还在探索中~

http://www.dtcms.com/a/346983.html

相关文章:

  • 【51单片机学习】直流电机驱动(PWM)、AD/DA、红外遥控(外部中断)
  • 脚本:git push直到成功(windows powershell命令)(Github连不上、Github断开)
  • UE5.3 中键盘按键和操作绑定
  • 37_基于深度学习的铝材缺陷检测识别系统(yolo11、yolov8、yolov5+UI界面+Python项目源码+模型+标注好的数据集)
  • openharmony之一多开发:产品形态配置讲解
  • 解码LLM量化:深入剖析最常见8位与4位核心算法
  • 【机器学习深度学习】多模态典型任务与应用全景
  • 【Canvas与徽章】中国制造金色玻璃光徽章
  • 计算机视觉工程师业务场景题:智能推荐视频封面
  • 链表-23.合并K个升序链表-力扣(LeetCode)
  • 【机器学习深度学习】模态与多模态的概念
  • ANSI终端色彩控制知识散播(II):封装的层次(Python)——不同的逻辑“一样”的预期
  • 广东省省考备考(第八十四天8.23)——言语、常识(强化训练)
  • d435i深度相机使用
  • 复杂工况漏检率↓79%!陌讯多模态融合算法在智慧能源设备检测的落地实践
  • 大模型如何一招打通,零标注也能SOTA
  • hd 单细胞空间转录组学习路径 stardist
  • 什么是AI宠物
  • ffmpeg 问答系列
  • 《三驾马车:MySQL、MongoDB、Redis对比与融合实战》
  • 可视化-模块1-HTML-01
  • UniAD
  • 电容反射特性
  • Linux netfilter工作原理详解
  • Spring Boot 整合网易163邮箱发送邮件实现找回密码功能
  • 数据库MVCC是什么
  • 每日算法题【链表】:链表的中间节点、返回倒数第k个节点、合并两个有序链表
  • Git checkout 与 Git reset 核心区别解析(分支与版本关联逻辑)
  • C语言初学者笔记【动态内存管理】
  • 在WSL2 Ubuntu中部署FastDFS服务的完整指南