当前位置: 首页 > news >正文

图解深度学习 - 激活函数和损失函数

激活函数和损失函数在深度学习中扮演着至关重要的角色。通过选择合适的激活函数和损失函数,可以显著提高神经网络的表达能力和优化效果。

其中激活函数是神经网络中的非线性函数,用于在神经元之间引入非线性关系,从而使模型能够学习和表示复杂的数据模式,常见的激活函数有 Sigmoid、Tanh、ReLU 和 Leaky ReLU;损失函数则是评估模型预测值与真实值之间的差异,通过最小化损失函数来优化模型参数,常见的损失函数有 MSE和交叉熵损失(Cross-Entropy Loss)。

图片


一、激活函数

激活函数(Activation Function)是什么在深度学习中,激活函数是神经网络中的非线性函数,用于在神经元之间引入非线性关系,从而使模型能够学习和表示复杂的数据模式。

如果神经网络没有像Relu这样的激活函数(也叫非线性激活函数),神经网络每层就只包含两个线性运算,即点积与加法:output = dot(input, W) + b。

神经网络中的每一层若仅进行线性变换(仿射变换),则其假设空间受限,无法充分利用多层表示的优势。因为多个线性层堆叠后,其整体运算仍然是线性的,增加层数并不能扩展假设空间。为了获得更丰富的假设空间,需要引入非线性因素,即激活函数。

图片

Sigmoid和Tanh是较早使用的激活函数,但存在梯度消失问题。ReLU及其变体(如Leaky ReLU、PReLU、ELU等)通过改进梯度消失问题,成为了当前隐藏层常用的激活函数。而softmax函数则专门用于多分类问题的输出层,将输出转换为概率分布。

  • Sigmoid:将输入值压缩到(0, 1)之间,常用于二分类问题的输出层。但存在梯度消失问题,且输出不以零为中心。

  • Tanh:将输入值压缩到(-1, 1)之间,输出均值为0,更适合隐藏层。但同样存在梯度消失问题。

  • ReLU:当输入大于0时,输出等于输入;当输入小于0时,输出为0。具有计算简单、梯度消失问题较轻的优点,是隐藏层常用的激活函数。但存在神经元死亡问题。

  • Leaky ReLU:解决了ReLU在输入小于0时梯度为0的问题,允许小的梯度流过。

  • Softmax:将输入向量中的每个元素映射到(0, 1)区间内,并且所有输出元素的和为1。用于多分类问题的输出层,将神经网络的输出转换为概率分布。

图片

“一图 + 一句话”彻底搞懂激活函数。

激活函数是神经网络中的非线性组件,用于在神经元间引入非线性关系,使模型能捕捉复杂数据模式,其中ReLU及其变体常用于隐藏层,而Softmax则专用于多分类输出层。

图片


二、损失函数

损失函数(Loss Function)是什么?在深度学习中,损失函数则是评估模型预测值与真实值之间的差异,通过最小化损失函数来优化模型参数。

在深度学习中,通过计算损失值,可以直观地了解模型的预测性能,从而指导模型的优化方向。神经网络通常使用梯度下降等优化算法来调整模型参数。

损失函数为这些优化算法提供了明确的目标和方向。通过不断减小损失值,可以逐步优化模型参数,提高模型的预测性能。常见类型包括均方误差、交叉熵损失等,选择时需根据任务类型、数据分布和特定需求进行考虑。

  • 均方误差(MSE):用于回归问题,计算预测值与真实值之间差的平方的平均值。

  • 交叉熵损失:用于分类问题,衡量模型预测概率分布与真实概率分布之间的差异。包括二分类交叉熵损失和多类别交叉熵损失。

图片

“一图 + 一句话”彻底搞懂损失函数。

损失函数是衡量模型预测值与真实值差异的函数,通过最小化损失函数优化模型参数,常见类型有均方误差(回归)和交叉熵损失(分类),选择时需根据任务需求。

图片


 资料分享

为了方便大家学习,我整理了一份深度学习资料+80G人工智能资料包(如下图)

不仅有入门级教程,配套课件,还有进阶实战,源码数据集,更有面试题帮你提升~

需要的兄弟可以按照这个图的方式免费获取


文章转载自:

http://ZbA3Uh9J.jmmzt.cn
http://lIeys5km.jmmzt.cn
http://9VDI42d7.jmmzt.cn
http://RZqzd1Sd.jmmzt.cn
http://HyfdSwRs.jmmzt.cn
http://zX8pKmhI.jmmzt.cn
http://SoFhY0Vf.jmmzt.cn
http://HmVJuYGf.jmmzt.cn
http://FhCWQtx9.jmmzt.cn
http://HvYc6SB3.jmmzt.cn
http://Sv1B3GOX.jmmzt.cn
http://yUkuWLaw.jmmzt.cn
http://dK3rsiMB.jmmzt.cn
http://iiMECP9H.jmmzt.cn
http://vsyr9U8P.jmmzt.cn
http://GJH5jfVN.jmmzt.cn
http://Gkzd4UpO.jmmzt.cn
http://dsoHb8dQ.jmmzt.cn
http://zPP7AI2w.jmmzt.cn
http://N1KTwmgH.jmmzt.cn
http://tPovXleV.jmmzt.cn
http://ZA8HK34M.jmmzt.cn
http://nG3TNZIl.jmmzt.cn
http://2m3weHD0.jmmzt.cn
http://1m4h7WQ9.jmmzt.cn
http://njjYpNhf.jmmzt.cn
http://fMEWC6Sf.jmmzt.cn
http://NQmMc4mn.jmmzt.cn
http://ha0N41sq.jmmzt.cn
http://mmiGQn1k.jmmzt.cn
http://www.dtcms.com/a/228646.html

相关文章:

  • 1130 - Host ‘xxx.x.xx.xxx‘is not allowed to connect to this MySQL server
  • 【JAVA版】意象CRM客户关系管理系统+uniapp全开源
  • 一、核心概念深入解析
  • 使用seaborn/matplotlib定制好看的confusion matrix
  • linux安全加固(非常详细)
  • 产品更新丨谷云科技ETLCloud 3.9.3 版本发布
  • Redis中的fork操作
  • Linux 软件安装方式全解(适用于 CentOS/RHEL 系统)
  • 解决 idea提示`SQL dialect is not configured` 问题
  • 面试经验 对常用 LLM 工具链(如 LlamaFactory)的熟悉程度和实践经验
  • NLP学习路线图(二十一): 词向量可视化与分析
  • Unity 性能优化终极指南 — GameObject 篇
  • 浅谈边缘计算
  • 基于LEAP模型在能源环境发展、碳排放建模预测及分析中实践应用
  • c++之STL容器的学习(上)
  • 『uniapp』把接口的内容下载为txt本地保存 / 读取本地保存的txt文件内容(详细图文注释)
  • 便捷高效能源服务触手可及,能耗监测系统赋能智能建筑与智慧城市
  • LEAP模型能源需求/供应预测、能源平衡表核算、空气污染物排放预测、碳排放建模预测、成本效益分析、电力系统优化
  • 无人机巡检智能边缘计算终端技术方案‌‌——基于EFISH-SCB-RK3588工控机/SAIL-RK3588核心板的国产化替代方案‌
  • 不确定性分析在LEAP能源-环境系统建模中的整合与应用
  • 多模态大语言模型arxiv论文略读(104)
  • 快速排序(Quick Sort)算法详解(递归与非递归)
  • 什么是AI芯片?
  • Git知识
  • 深入解析Playwright for Python:浏览器功能与代码实例详解
  • 使用大模型预测亚急性脊髓联合变性的技术方案大纲
  • 基于PostGIS的GeoTools执行原生SQL查询制图实践-以贵州省行政区划及地级市驻地为例
  • C++--范围for循环详解
  • 记一次sql按经纬度计算距离
  • Fuse.js:打造极致模糊搜索体验