当前位置: 首页 > news >正文

激活函数学习笔记

  1. Sigmoid:梯度消失、指数计算复杂运行慢、输出不是以0为中心,梯度平滑便于求导
  2. tanh:以0为中心,其他与sigmoid相似
  3. ReLu:transformer常用,解决了梯度消失问题、计算复杂度低,存在神经元死亡问题和梯度不连续问题
  4. LeakyReLu:解决了ReLu神经元死亡的问题
  5. GLu:门控线性单元,两个线性变换,其中一个经过sigmoid输出,通过哈达玛积控制另一个线性变化,具有信息选择能力
  6. GeLu:高斯误差线性单元,x*P(X>=x),使用高斯分布的累计函数进行dropout
  7. Swish:x*σ(βx),使用sigmoid进行dropout,β等于1时是SiLu,极大时区域ReLu,等于0是x,梯度连续平滑,非单调性增强了学习能力
  8. SiLu:β等于1时的Swish
  9. SwiGLu:将GLu的σ函数替换为Swish函数,优势在于平滑梯度、门控特性、梯度稳定性和可学习参数

相关文章:

  • es 3期 第28节-深入掌握集群组建与集群设置
  • 清理redis缓存
  • 架构师论文《论软件质量保证及其应用》
  • 令牌与签名的区别(IT安全/认证机制)
  • blender场景导入Unity的流程(个人总结)
  • net8.0 使用JWT完成登录验证
  • NVR接入录像回放平台EasyCVR视频系统守护舌尖上的安全,打造“明厨亮灶”云监管平台
  • Playwright与Browser Use:领略AI赋能UI自动化测试的魔法魅力
  • 从入门到精通【MySQL】 联合查询
  • Springboot学习笔记3.28
  • TestNG简介
  • 吴恩达深度学习复盘(4)神经网络的前向传播
  • Linux中的权限管理
  • git clone 提示需要登录 github
  • #Linux内存管理# 在32bit Linux中,内核空间的线性映射的虚拟地址和物理地址是如何换算的?
  • PWA 进阶教程(三): 如何在 PWA 中实现后台同步
  • mediacodec服务启动时加载media_codecs.xml
  • MySql面试总结(五)
  • 关于修改 vue Element admin、若依, 等后台管理系统模板的一些全局样式问题:
  • 这样看数组
  • 哲学新书联合书单|远离苏格拉底
  • 缺字危机:一本书背后有多少“不存在”的汉字?
  • 长沙通报一出租房疑存非法代孕:查封涉事场所,相关人员被控制
  • 为证明我爸是我爸,我将奶奶告上法庭
  • 中俄弘扬正确二战史观:缅怀历史,重拾初心,阻止悲剧重演
  • 云南临沧一行贿案金额认定比受贿案多41万,重审时检方变更金额起诉