当前位置: 首页 > news >正文

01 神经网络简介

1 单个神经元如何感知信息

1.1 激活函数

感知信息的基本条件是对不同的输入能够区分
σ(x)={1x≥T0x<T, \sigma(x)=\left\{\begin{array}{ll} 1 & x \geq T \\ 0 & x<T \end{array},\right. σ(x)={10xTx<T,
在这里插入图片描述
以身高提取器来理解激活函数σ(x)\sigma(x)σ(x)

  • 当小于160cm,信号接收器接收到反射信号;
  • 当大于等于160cm,信号接收器接收不到反射信号。

1.2 权重

一个预测股票升降的例子:假设A 有两个朋友,B 和C。A 自己有一个判断值a0a_0a0,同时接收到了B和C的信息,分别记为b和c。因此,A接收到的信息为:
a=λ1b+λ2c+a0 a = \lambda_1b+ \lambda_2c + a_0 a=λ1b+λ2c+a0
如果B是一个经济学家,而C 是一个普通人,则有,λ1λ_1λ1>λ2λ_2λ2>0。
我们可以把这类收集信息的方式推广到一般的形式:
在这里插入图片描述
w1x1+⋯+wdxd+b=(w1,⋯ ,wd)⋅(x1,⋯ ,xd)+b=wTx+b \begin{array}{l} w_{1} x_{1}+\cdots+w_{d} x_{d}+b \\ =\left(w_{1}, \cdots, w_{d}\right) \cdot\left(x_{1}, \cdots, x_{d}\right)+b \\ =\boldsymbol{w}^{T} \boldsymbol{x}+b \end{array} w1x1++wdxd+b=(w1,,wd)(x1,,xd)+b=wTx+b
单个神经元的输出为:
σ(wTx+b) \sigma(\boldsymbol{w}^{T} \boldsymbol{x}+b) σ(wTx+b)
σ(⋅)\sigma(\cdot)σ()通常称为激活函数。

一个预测股票升降的例子:假设A 有两个朋友,B 和C。A 自己有一个判断值a0a_0a0,同时接收到了B和C的信息,分别记为b和c。因此,A接收到的信息为:
a=λ1b+λ2c+a0 a = \lambda_1b+ \lambda_2c + a_0 a=λ1b+λ2c+a0
如果B是一个经济学家,而C 是一个普通人,则有,λ1λ_1λ1>λ2λ_2λ2>0。

2 单层神经网络

简单地把多个神经元堆在一起,我们就可以得到单层神经网络:
在这里插入图片描述
神经网络的高维输出:
在这里插入图片描述
参数的矩阵形式:
在这里插入图片描述
∘ 表示对每个元素作用:
在这里插入图片描述

2.1 设计功能

考虑输入是两维的,x1,x2∈{0,1}2x_1,x_2∈\{0,1\}^2x1,x2{0,1}2
σ(x)={1x1+x2≥T0x1+x2<T, \sigma(x)=\left\{\begin{array}{ll} 1 & x_1 + x_2 \geq T \\ 0 & x_1 + x_2<T \end{array},\right. σ(x)={10x1+x2Tx1+x2<T,

  • AND: T=2;即11为1,00,01,10都是0;
  • Or: T=1;即00为0,01,10,11都是1;
  • Not: T=0;σ(x)=−xσ(x)=−xσ(x)=x这里还没理解到是如何运作的?

2.2 局限性

单层神经网络是无法做好XOR问题:
在这里插入图片描述

3 多层神经网络

多层神经网络是在一层神经网络的基础上堆叠起来的。
在这里插入图片描述

3.1 解XOR问题

在这里插入图片描述

  • 假设,y=σ(h1+h22)y=σ(\frac{ℎ_1+ℎ_2}{2})y=σ(2h1+h2)
  • 代入(0,0), (1,1),则y=σ(1)=1y=σ(1)=1y=σ(1)=1
  • 代入(1,0), (0,1),则y=σ(1/2)=0y=σ(1/2)=0y=σ(1/2)=0

性质

  • 两层网络具有万有逼近定理(Cybenko 1989):激活函数是非多项式的非线性函数
  • 多项式函数是否有万有逼近定理?
  • 为什么激活函数不能是多项式函数?
  • 万有逼近定理对实际问题有什么帮助?
  • 万有逼近定理是否足够让我们使用神经网络?
  • 多层神经网络只是众多机器学习方法中的一种!
http://www.dtcms.com/a/366627.html

相关文章:

  • 2025国赛C题题目及最新思路公布!
  • 代码随想录二刷之“贪心算法”~GO
  • 【笔记】Software Engineering at Google
  • 25年Docker镜像无法下载的四种对策
  • 国产GEO工具哪家强?巨推集团、SEO研究协会网、业界科技三强对比
  • 如何监控员工的电脑?7款实用的员工电脑管理软件,探索高效管理捷径!
  • Spring Cloud Eureka 核心原理
  • Spring简单的读取和存储对象
  • Axure RP 9 Mac 交互原型设计
  • Ubuntu 25.04搭建hadoop3.4.1集群详细教程
  • SpringBoot 网络流量抓包与分析系统
  • DevOps平台选型指南:破解研发效率瓶颈,适配金融/政务/国产化场景的5大关键指标
  • 【数据可视化-108】2025年6月新能源汽车零售销量TOP10车企分析大屏(PyEcharts炫酷黑色主题可视化)
  • C#强制类型转换(显示转换)和安全类型转换
  • 激光频率梳 3D 轮廓测量 - 莫尔条纹光的工作原理及优缺点
  • 2025变现打法:AI+IP实现高效变现|创客匠人
  • Mysql杂志(九)
  • Agent Prompt工程:如何让智能体更“听话”?(实践指南)
  • 深度学习玩游戏, 模型玩游戏,大模型+游戏 llm+game, 机器学习玩游戏,人工智能游戏陪伴,模型陪玩游戏
  • 机器学习基础-day02-K近邻算法
  • 大数据框架Doris全面解析
  • 学习机器学习能看哪些书籍
  • 计算机毕业设计:基于Python的影评情感分析可视化推荐系统
  • 【嵌入式DIY实例-ESP32篇】-倾斜弹跳球游戏
  • 【CouponHub项目开发】使用RocketMQ5.x实现延时修改优惠券状态,并通过使用模板方法模式重构消息队列发送功能
  • Unity中,软遮罩SoftMaskForUGUI可移动遮罩形状实现方法
  • 阻抗、瞬时阻抗、特性阻抗的区别
  • AI重构出海营销:HeadAI如何用“滴滴模式”破解红人营销效率困局?
  • 元宇宙与教育变革:沉浸式学习重构知识获取与能力培养
  • 从关键词到语义理解:小陌引擎如何重构AI搜索优化逻辑?