当前位置：首页 > news >正文

激活函数学习笔记

news 2025/10/31 6:38:39

Sigmoid：梯度消失、指数计算复杂运行慢、输出不是以0为中心，梯度平滑便于求导
tanh：以0为中心，其他与sigmoid相似
ReLu：transformer常用，解决了梯度消失问题、计算复杂度低，存在神经元死亡问题和梯度不连续问题
LeakyReLu：解决了ReLu神经元死亡的问题
GLu：门控线性单元，两个线性变换，其中一个经过sigmoid输出，通过哈达玛积控制另一个线性变化，具有信息选择能力
GeLu：高斯误差线性单元，x*P(X>=x)，使用高斯分布的累计函数进行dropout
Swish：x*σ(βx)，使用sigmoid进行dropout，β等于1时是SiLu，极大时区域ReLu，等于0是x，梯度连续平滑，非单调性增强了学习能力
SiLu：β等于1时的Swish
SwiGLu：将GLu的σ函数替换为Swish函数，优势在于平滑梯度、门控特性、梯度稳定性和可学习参数

http://www.dtcms.com/a/105446.html

相关文章：

es 3期第28节-深入掌握集群组建与集群设置

清理redis缓存

架构师论文《论软件质量保证及其应用》

令牌与签名的区别（IT安全/认证机制）

blender场景导入Unity的流程（个人总结）

net8.0 使用JWT完成登录验证

NVR接入录像回放平台EasyCVR视频系统守护舌尖上的安全，打造“明厨亮灶”云监管平台

Playwright与Browser Use：领略AI赋能UI自动化测试的魔法魅力

从入门到精通【MySQL】联合查询

Springboot学习笔记3.28

TestNG简介

吴恩达深度学习复盘(4)神经网络的前向传播

Linux中的权限管理

git clone 提示需要登录 github

#Linux内存管理# 在32bit Linux中，内核空间的线性映射的虚拟地址和物理地址是如何换算的？

PWA 进阶教程（三）：如何在 PWA 中实现后台同步

mediacodec服务启动时加载media_codecs.xml

MySql面试总结（五）

关于修改 vue Element admin、若依，等后台管理系统模板的一些全局样式问题：

这样看数组

【TS学习】（19）TS中的类

机器学习(八)：K-Means聚类原理与实战

CSS3学习教程，从入门到精通，化妆品网站 HTML5 + CSS3 完整项目（26）

Debian/Ubuntu的networking的`/etc/network/interfaces`配置文件详解

bilibili全链路压测改造之全链自动化测试实践

ZLMediaKit 源码分析——[3] ZLToolKit 中EventPoller之网络事件处理

Jmeter操作（数据库）

讯投 QMT 使用小技巧 -如何判断今天是不是交易日

Java 流程控制关键字全解析：break、continue 与 goto 的深度实践指南

uniapp APP端在线升级（简版）