当前位置：首页 > news >正文

深度学习卷积层

news 2025/10/22 9:50:47

分类猫和狗的图片

使用一个相机采集图片(12M像素), RGB图片有36M元素, 使用100大小的单隐藏层MLP, 模型有3.6B元素, 远多于世界上所有猫和狗总数(900M狗, 600M猫), 所以如果采用原始的MLP解决需要16亿的参数, 那么卷积神经网络提供了一个新的解决办法

两个原则

平移不变性: 不论分类是在那个地方看应当都是差不多的
局部性: 只需要观察一部分数据, 不需要观察全局的数据

全联接层到卷积层

将输入和输出变形为矩阵(宽度, 高度)
将权重变形为4-D张量(h, w), 到(h’, w’)
$h_{i,j} = \sum_{k,l}w_{i,j,k,l} = \sum_{a,b}v_{i,j,a,b}x_{i+a,j+b}$
$h_{i,j}$ 是输出, V是W的重新索引 $V_{i,j,a,b}=W_{i,j,i+a,j+b}$

平移不变性

X的平移导致h的平移 $hi,j=∑a,bVi,j,a,bXi+a,j+bh_{i,j}=\sum_{a,b}V_{i,j,a,b}X_{i+a,j+b}$
V不应该依赖(i, j)
解决方案: $V_{i,j,a,b}=V_{a,b}$
$h_{i,j} = \sum_{a,b}V_{a,b}X_{i+a,j+b}$
这就是二维的交叉相关

局部性

$h_{i,j} = \sum_{a,b}V_{a,b}X_{i+a,j+b}$
当评估 $h_{i,j}$ 时, 我们不应该用远离 $X_{i,j}$ 的参数, 解决方案, 当 $\Delta$ 时, 使得 $V_{a,b}=0$
$h_{i,j}=\sum_{a=-\Delta}^{\Delta}\sum_{b=-\Delta}^{\Delta}V_{a,b}X_{i+a,j+b}$ `

http://www.dtcms.com/a/512042.html

相关文章：

网页设计模板图片素材下载重庆公司seo

网站先做移动站在做pc站可行吗工程服务建设网站

C++第十三篇：继承

GD32F407VE天空星开发板SPI配置详解

公司网站建设优帮云企业网站建设需注意什么

垂直原理：宇宙的沉默法则与万物运动的终极源头

如何在没有 iCloud 的情况下备份 iPhone

江苏专业网站建设ps软件手机版

番禺制作网站平台女孩学电子商务专业好就业吗

自动点焊机——为电动自行车打造稳定动力

栈与队列：数据结构中的双雄对决

Jenkins 安装，自动化全方位详解文档

第八节_PySide6基本窗口控件_按钮类控件（QAbstractButton）

iBizModel 工作流（PSWORKFLOW）模型体系详解

装修公司网站源码网站怎样做免费优化有效果

20.1 ChatPPT v3.0颠覆发布：多模态图像识别+AI生成，办公效率提升500%的核心拆解

【PyTorch】单目标检测部署

3D超点（3D Superpoint）概念解释与代码实现

TPAMI 2025 | 从分离到融合：新一代3D场景技术实现双重能力提升！

malloc/free 内存问题

国企集团门户网站建设方案有什么做数学题的网站

CredentialProvider多用户登录实现

‘/‘ 和 ‘./‘在Vite中的区别

技术指南：如何高效地将SOLIDEDGE模型转换为3DXML格式

C#上位机工程师技能清单文档

考研408《操作系统》复习笔记，第二章《2.4 同步互斥》

复现AB3DMOT 3D目标跟踪

两种方法解决SQL连续登录问题

一种简易的python c++协同定位和dump数据的方式

蒙帕视角丨图像高效端到端目标检测