当前位置: 首页 > news >正文

激活函数学习笔记

  1. Sigmoid:梯度消失、指数计算复杂运行慢、输出不是以0为中心,梯度平滑便于求导
  2. tanh:以0为中心,其他与sigmoid相似
  3. ReLu:transformer常用,解决了梯度消失问题、计算复杂度低,存在神经元死亡问题和梯度不连续问题
  4. LeakyReLu:解决了ReLu神经元死亡的问题
  5. GLu:门控线性单元,两个线性变换,其中一个经过sigmoid输出,通过哈达玛积控制另一个线性变化,具有信息选择能力
  6. GeLu:高斯误差线性单元,x*P(X>=x),使用高斯分布的累计函数进行dropout
  7. Swish:x*σ(βx),使用sigmoid进行dropout,β等于1时是SiLu,极大时区域ReLu,等于0是x,梯度连续平滑,非单调性增强了学习能力
  8. SiLu:β等于1时的Swish
  9. SwiGLu:将GLu的σ函数替换为Swish函数,优势在于平滑梯度、门控特性、梯度稳定性和可学习参数
http://www.dtcms.com/a/105446.html

相关文章:

  • es 3期 第28节-深入掌握集群组建与集群设置
  • 清理redis缓存
  • 架构师论文《论软件质量保证及其应用》
  • 令牌与签名的区别(IT安全/认证机制)
  • blender场景导入Unity的流程(个人总结)
  • net8.0 使用JWT完成登录验证
  • NVR接入录像回放平台EasyCVR视频系统守护舌尖上的安全,打造“明厨亮灶”云监管平台
  • Playwright与Browser Use:领略AI赋能UI自动化测试的魔法魅力
  • 从入门到精通【MySQL】 联合查询
  • Springboot学习笔记3.28
  • TestNG简介
  • 吴恩达深度学习复盘(4)神经网络的前向传播
  • Linux中的权限管理
  • git clone 提示需要登录 github
  • #Linux内存管理# 在32bit Linux中,内核空间的线性映射的虚拟地址和物理地址是如何换算的?
  • PWA 进阶教程(三): 如何在 PWA 中实现后台同步
  • mediacodec服务启动时加载media_codecs.xml
  • MySql面试总结(五)
  • 关于修改 vue Element admin、若依, 等后台管理系统模板的一些全局样式问题:
  • 这样看数组
  • 【TS学习】(19)TS中的类
  • 机器学习(八):K-Means聚类原理与实战
  • CSS3学习教程,从入门到精通, 化妆品网站 HTML5 + CSS3 完整项目(26)
  • Debian/Ubuntu的networking的`/etc/network/interfaces`配置文件详解
  • bilibili全链路压测改造之全链自动化测试实践
  • ZLMediaKit 源码分析——[3] ZLToolKit 中EventPoller之网络事件处理
  • Jmeter操作(数据库)
  • 讯投 QMT 使用小技巧 -如何判断今天是不是交易日
  • Java 流程控制关键字全解析:break、continue 与 goto 的深度实践指南
  • uniapp APP端在线升级(简版)