当前位置：首页 > news >正文

24、深度学习-自学之路-卷积神经网络

news 2025/10/15 15:10:24

一、你怎么理解卷积神经网络呢，我的理解是当你看一个东西的时候，你的眼睛距离图片越近，你看到的东西就越清晰，但是如果你看到的图片只是整个物体的一小部分，那么你将不知道你看到的物品是什么，因为关注整体更容易知道物品是什么。如果你保持一定的距离，你就会发现你可以看到物品更加的全貌一些，这样将方便你观察物品的类别。如果你距离的再远一点，你就会看到物品的轮廓，那么你将依据物品的轮廓去判断物品的类别。

如果图片的噪声很多，我们可以距离物品远一点，这样我们看的东西的轮廓来判断物品更合适。

如果图片的噪声很小，那我们可以距离物品近一点，就可以看到物品的类型。

可能这么理解还不够准确，不够这样理解我更加方便理解。

二、下面我们来说一下，一个卷积神经网络包含哪些：

大家可以在哔哩哔哩上搜《【数之道 08】走进"卷积神经网络"，了解图像识别背后的原理》

他讲的已经非常好了。

其实还有一个输入层，如果一定要这么理解的话，我们的图片就是输入层。

1、卷积层：卷积层指的是把一张图片，按照纵向和横向的提取方法，来提取图片的特征。

按照3*3

0 1 0

0 1 0

0 1 0

和

0 0 0

1 1 1

0 0 0

在一个6*6（一般为了提取的信息更加准确，还是把（6*6的上下作用添加0，组成8*8）的图片上以此从做往右进行提取。提取图片的横向和纵向特征。

提取完的是一个6*6的图片矩阵。

2、最大池化层：

按照2*2的方式来提取6*6找到每一个小的2*2小矩阵的最大值作为最后3*3矩阵的输入值。

3、全连接层

也就是我们在神经元中的输入成和对应的隐藏层

输入成是纵向3*3展开后的1*9的输入层，还有加上横向输入层也是1*9，一共最后是1*18

隐藏层可以是一层，也可以是多层。

中间使用激活函数relu进行激活

4、输出层

输出我们识别的或者是数字，如果我们还是在MNIST上进行的练习，我们可以得到就是我们能识别的数字，其中再加上我们熟悉的输出层的激活函数softmax。可以更好的识别图片中的数字。

这么结合着来理解会更好。

http://www.dtcms.com/a/13611.html

相关文章：

【OpenCV】双目相机计算深度图和点云

归并排序和七大算法的总结图

【php】php json_encode($arr) 和 json_encode($arr, 320) 有什么区别？

DeepSeek 指导手册（入门到精通）

C++从入门到实战（三）缺省参数与函数重载

Navicat导入海量Excel数据到数据库（简易介绍）

Spring 项目接入 DeepSeek，分享两种超简单的方式!

Redis7.0八种数据结构底层原理

HTML的入门

Vue笔记（十）

深度剖析责任链模式

游戏引擎学习第100天

走进 Tcl 语言：历史、特性与应用

C++ ——从C到C++

C++，STL容器适配器，stack：栈深入解析

docker compose部署flink集群

【Vue中BUG解决】npm error path git

macOS 上部署 RAGFlow

【经验分享】Linux 系统安装后内核参数优化

微信小程序医院挂号系统

Visual Studio踩过的坑

Mac上搭建宝塔环境并部署PHP项目

侯捷 C++ 课程学习笔记：C++ 新标准 11/14 的革新与实战应用

【深入探讨 ResNet：解决深度神经网络训练问题的革命性架构】

Qt Designer菜鸟使用教程（实现一个本地英文翻译软件）

《8天入门Trustzone/TEE/安全架构》

从 0 开始本地部署 DeepSeek：详细步骤 + 避坑指南 + 构建可视化（安装在D盘）

零基础入门机器学习 -- 第三章第一个机器学习模型——线性回归

java安全中的类加载

【一文读懂】HTTP与Websocket协议