当前位置: 首页 > news >正文

【全连接神经网络】基本原理

文章目录

    • 1.1全连接神经网络的整体结构
    • 1.2全连接神经网络的结构单元
    • 1.3激活函数
      • 1.3.1 sigmoid激活函数
      • 1.3.2 Tanh激活函数
      • 1.3.3 ReLU激活函数
      • 1.3.4 Leaky ReLU激活函数
      • 1.3.5 注意
    • 1.4前向传播
    • 1.5损失函数
      • 1.5.1均方误差损失函数
    • 1.6反向传播
      • 1.6.1梯度下降法

1.1全连接神经网络的整体结构

基本组成: 输入层 ------> 若干隐藏层 ------> 输出层

在这里插入图片描述

1.2全连接神经网络的结构单元

结构单元,也可以说是 神经元。即图中的一个个圈 O

在这里插入图片描述

一个神经元的运算逻辑如下:
a=h(W11∗X1+W12∗X2+W13∗X3+b1)a=h(W_{11}*X_1+W_{12}*X_2+W_{13}*X_3+b_1) a=h(W11X1+W12X2+W13X3+b1)
其中,wb 称为 参数h激活函数x 是输入,a 是输出,一个好的神经网络就是找到一组最优的w和b,使模型输出a最优。

在这里插入图片描述

1.3激活函数

激活函数一般选 非线性函数,线性函数可能会导致隐藏层失效。

1.3.1 sigmoid激活函数

在这里插入图片描述

1.3.2 Tanh激活函数

在这里插入图片描述

1.3.3 ReLU激活函数

在这里插入图片描述

1.3.4 Leaky ReLU激活函数

在这里插入图片描述

1.3.5 注意

可以观察到,激活函数各有优缺点,没有最好的激活函数,只有最合适的激活函数。

1.4前向传播

通俗来说,前向传播就是:给定输入X,计算模型的输出结果Y。

一个简单的例子如下:

在这里插入图片描述

1.5损失函数

通俗来说,就是计算 预测值真实值 之间的误差。既然是误差的话,当然是越小越好。

1.5.1均方误差损失函数

公式如下:

其中,m是样本数,f(x)是模型预测值,即前向传播的最终结果,它也是w和b的函数,y是真实值。1/2是为了求导方便,更好的计算梯度。
J(w,b)或J(x)=12m∑i=1m(f(xi)−yi)2J(w, b)或J(x)=\frac {1}{2m}\sum_{i=1}^m(f(x_i)-y_i)^2 J(w,b)J(x)=2m1i=1m(f(xi)yi)2

1.6反向传播

前面讲“一个好的神经网络就是找到一组最优的w和b,使模型输出a最优”,怎么找到最优的w和b?靠的就是 反向传播

反向传播的作用是更新参数w和b。常用梯度下降法。

1.6.1梯度下降法

梯度下降法参数更新的计算公式如下:
w=w−a∂J(w,b)∂wb=b−a∂J(w,b)∂bw=w-a\frac {\partial J(w, b)}{\partial w} \\ b=b-a\frac {\partial J(w, b)}{\partial b} w=wawJ(w,b)b=babJ(w,b)
来看一个具体的例子:

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述


2025.10.12 上午学习做的该笔记,前两天看的是土堆哥的视频,但是我感觉他的风格不太适合我,听着感觉很累,而且他的视频太久远了,我怕…,还是跟炮哥吧,简单粗暴,本篇的内容之前学过,这里再复习一下,还是有收获的。我导师放养我,不知道是好是坏,主要怕毕不了业,开学一个月了组会没开过论文没看过,我怕落后别人太多,先学点东西,自我安慰,哈哈哈哈呜呜呜呜呜…

http://www.dtcms.com/a/473636.html

相关文章:

  • Go 异步编程
  • 基于贪心最小化包围盒策略的布阵算法
  • 《Python 异步数据库访问全景解析:从阻塞陷阱到高性能实践》
  • AI 自己造“乐高积木”:生成式 AI 设计可拼装模块化硬件的实战笔记
  • 10.11笔记
  • 冒泡排序的多种实现方式详解
  • 网页设计平面设计温州网站优化页面
  • 特别分享:聊聊Git
  • M|蝙蝠侠:侠影之谜
  • crawl4ai智能爬虫(一):playwright爬虫框架详解
  • 探究Java、C语言、Python、PHP、C#与C++在多线程编程中的核心差异与应用场景
  • 国外网站模板网站建设ui培训班好
  • 瑞安建设公司网站旅游网站系统的设计与实现
  • MongoDB-基本介绍(一)基本概念、特点、适用场景、技术选型
  • 国产之光金仓数据库,真能平替MongoDB?实测来了!
  • 网站开发需要学什么语言wordpress所有栏目循环输出
  • 低代码革命:拖拽式界面生成器与API网关的深度集成
  • “事件风暴 → 上下文映射 → 模块化”在 ABP vNext 的全链路模板
  • 如何在Linux服务器上部署jenkins?
  • 2.1 阵列信号处理基础
  • Centos7下docker的jenkins下载并配置jdk与maven
  • 网络数据侦探:抓包工具在爬虫开发中的艺术与科学
  • 手搓docker - 实现篇
  • soho做网站谷歌推广网站建设采购项目
  • 深入理解HTTP协议的本质
  • 以太网通信
  • 网站运营推广方式网站建设需要学编程么
  • 开源合规:GPL-3.0项目的专利风险规避
  • Java基于SpringBoot的医院门诊管理系统,附源码+文档说明
  • windows查询与设备通讯的mac地址