当前位置：首页 > wzjs >正文

php网站插件工商注册平台官网

wzjs 2025/9/4 3:21:00

php网站插件,工商注册平台官网,wordpress 论坛注册,wordpress 首页的代码以下内容为结合李沐老师的课程和教材补充的学习笔记，以及对课后练习的一些思考，自留回顾，也供同学之人交流参考。本节课程地址：45 SSD实现【动手学深度学习v2】_哔哩哔哩_bilibili 本节教材地址：13.7. 单发多框检测（SSD） — 动手学深度学习 2.0.0 documentation 本节…

以下内容为结合李沐老师的课程和教材补充的学习笔记，以及对课后练习的一些思考，自留回顾，也供同学之人交流参考。

本节课程地址：45 SSD实现【动手学深度学习v2】_哔哩哔哩_bilibili

本节教材地址：13.7. 单发多框检测（SSD） — 动手学深度学习 2.0.0 documentation

本节开源代码：…>d2l-zh>pytorch>chapter_optimization>ssd.ipynb

单发多框检测（SSD）

在 13.3节 — 13.6节中，我们分别介绍了边界框、锚框、多尺度目标检测和用于目标检测的数据集。现在我们已经准备好使用这样的背景知识来设计一个目标检测模型：单发多框检测（SSD） (Liu et al., 2016)。该模型简单、快速且被广泛使用。尽管这只是其中一种目标检测模型，但本节中的一些设计原则和实现细节也适用于其他模型。

模型

图13.7.1 描述了单发多框检测模型的设计。此模型主要由基础网络组成，其后是几个多尺度特征块。基本网络用于从输入图像中提取特征，因此它可以使用深度卷积神经网络。单发多框检测论文中选用了在分类层之前截断的VGG (Liu et al., 2016)，现在也常用ResNet替代。我们可以设计基础网络，使它输出的高和宽较大。这样一来，基于该特征图生成的锚框数量较多，可以用来检测尺寸较小的目标。接下来的每个多尺度特征块将上一层提供的特征图的高和宽缩小（如减半），并使特征图中每个单元在输入图像上的感受野变得更广阔。

回想一下在 13.5节中，通过深度神经网络分层表示图像的多尺度目标检测的设计。由于接近图13.7.1 顶部的多尺度特征图较小，但具有较大的感受野，它们适合检测较少但较大的物体。简而言之，通过多尺度特征块，单发多框检测生成不同大小的锚框，并通过预测边界框的类别和偏移量来检测大小不同的目标，因此这是一个多尺度目标检测模型。
在这里插入图片描述

在下面，我们将介绍图13.7.1 中不同块的实施细节。首先，我们将讨论如何实施类别和边界框预测。

[类别预测层]

设目标类别的数量为 $q$ 。这样一来，锚框有 $q + 1$ 个类别，其中0类是背景。在某个尺度下，设特征图的高和宽分别为 $h$ 和 $w$ 。如果以其中每个单元为中心生成 $a$ 个锚框，那么我们需要对 $h w a$ 个锚框进行分类。如果使用全连接层作为输出，很容易导致模型参数过多。回忆 7.3节一节介绍的使用卷积层的通道来输出类别预测的方法，单发多框检测采用同样的方法来降低模型复杂度。

具体来说，类别预测层使用一个保持输入高和宽的卷积层。这样一来，输出和输入在特征图宽和高上的空间坐标一一对应。考虑输出和输入同一空间坐标（ $x$ 、 $y$ ）：输出特征图上（ $x$ 、 $y$ ）坐标的通道里包含了以输入特征图（ $x$ 、 $y$ ）坐标为中心生成的所有锚框的类别预测。因此输出通道数为 $a (q + 1)$ ，其中索引为 $i (q + 1) + j$ （ $\leq j \leq q$ ）的通道代表了索引为 $i$ 的锚框有关类别索引为 $j$ 的预测。

补充-对于SSD降低模型复杂度的解释：

使用全连接层存在的问题
目标检测需要在特征图上的每个单元生成 $a$ 个锚框。对于每个锚框，都需要预测其属于哪个类别（共有 $q + 1$ 个类别，包括背景）。
假设特征图大小为 $\times w$ ，那么总共需要预测的锚框数量是 $\times w \times a$ 。

如果使用全连接层来为每个锚框预测类别的话，那么：

输入需要展平成一个巨大的向量，长度为 $\times w \times C_{in}$ ，其中 $C_{in}$ 是输入特征图的通道数。
输出需要一个同样巨大的向量，长度为 $\times w \times a \times (q+1)$ ，包含所有锚框的所有类别预测。
那么，全连接层的参数量将有 $C_{in}) \times (h w a (q+1))$ 。并且参数量会随着特征图尺寸 $h$ 和 $w$ 增大而呈二次方增长，随锚框数 $a$ 和类别数 $q + 1$ 的增多而线性增长，因此，全连接层的使用会导致模型过于复杂，难以训练和部署。

SSD的解决方法：空间位置保持的卷积层
SSD的类别预测层（代码在下面）使用了一个卷积核为3x3、填充为1的卷积层，这种设置保证了输入特征图 ( $\times w \times C_{in}$ ) 和输出特征图 ( $\times w \times C_{out}$ )在高度和宽度上完全一致（空间坐标一一对应）。

这一设置同时还可以利用通道维度编码预测信息：
- 卷积层输出通道数被设为 $C_out = a \times (q+1)$ ，输出的每个空间位置（ $x$ 、 $y$ ）的通道向量，包含了以输入特征图上对应位置（ $x$ 、 $y$ ）为中心生成的所有 $a$ 个锚框的类别预测信息。
- 输出特征图在（ $x$ 、 $y$ ）位置的第 $k$ 个通道的值，代表：
- 锚框索引 $i = k // (q + 1)$ （整数除法，向下取整，决定了是 $a$ 个锚框中的哪一个）；
- 类别索引 $j = k$ （取余运算，决定了是哪个类别，包括背景）；
- 也即： $k = i * (q + 1) + j$ 。

如此一来，类别预测层的卷积核在整个特征图的 $\times w$ 个空间位置上是共享参数的。同一个卷积核负责处理所有空间位置上相同 $i, j$ 索引组合的预测。而且，每个输出的预测值（某个位置（ $x$ 、 $y$ ）的某个通道 $k$ ）只依赖于输入特征图上（ $x$ 、 $y$ ）位置及其邻域的值，而不是像全连接层那样依赖于整张图的输入。

从参数量上，卷积层的参数量为 $C_{in} \times C_{out} \times kernel_{height} * kernel_{width} = C_{in} \times (a (q+1)) \times 3 \times 3$ ，只取决于卷积核的大小和输入/输出通道数呈线性相关，而与特征图尺寸完全无关，相比于全连接层，卷积层节省了大量的参数数量，极大地降低了模型的复杂度，使其更易于训练和部署。

在下面，我们定义了这样一个类别预测层，通过参数num_anchors和num_classes分别指定了 $a$ 和 $q$ 。该图层使用填充为1的 $3\times3$ 的卷积层。此卷积层的输入和输出的宽度和高度保持不变。

%matplotlib inline
import torch
import torchvision
from torch import nn
from torch.nn import functional as F
from d2l import torch as d2l
import numpy as np
from torchvision import transforms
from PIL import Image# 类别预测层
def cls_predictor(num_inputs, num_anchors, num_classes):return nn.Conv2d(num_inputs, num_anchors * (num_classes + 1), # +1是加背景类别kernel_size=3, padding=1)

(边界框预测层)

边界框预测层的设计与类别预测层的设计类似。唯一不同的是，这里需要为每个锚框预测4个偏移量，而不是 $q + 1$ 个类别。

def bbox_predictor(num_inputs, num_anchors):return nn.Conv2d(num_inputs, num_anchors * 4, kernel_size=3, padding=1)

[连结多尺度的预测]

正如我们所提到的，单发多框检测使用多尺度特征图来生成锚框并预测其类别和偏移量。在不同的尺度下，特征图的形状或以同一单元为中心的锚框的数量可能会有所不同。因此，不同尺度下预测输出的形状可能会有所不同。

在以下示例中，我们为同一个小批量构建两个不同比例（Y1和Y2）的特征图，其中Y2的高度和宽度是Y1的一半。以类别预测为例，假设Y1和Y2的每个单元分别生成了

查看全文

http://www.dtcms.com/wzjs/601248.html

北京seo网站推广费用用自己服务器做网站

公司静态网站模板天津河西做网站贵吗

下列关于网站开发中网页上传网站建设电话销售工作总结

如何制作一个动态的网站的登录详细步骤页面h5手机网站源码下载

网站备案授权门户网站是啥意思

优化网站界面的工具百度怎么发帖子

网站建设外出考察信息阿里巴巴网站规划

怎么做网站不用备案大公司网站建设建网站

温州网站建设免费咨询同花顺回应“app崩了”:正在排查

巫溪集团网站建设之梦系统怎么修改网站标头图片

哈尔滨快速建站公司推荐单页面网站设计

公司网站制作费用宁波网站建设设计制作

做网站服务器租一年多少钱网络推广 SEO优化网站建设

网站建设背景需要写些什么媒体发稿平台

顺德人做多上哪个网站网络服务检测与维护

网站流量高有什么用seo培训多少钱

天津开发区网站设计公司商城网站后台管理系统

三部曲网站建设广东好的网络营销机构

深圳专业seo优化公司网站关键词优化建议

自己做的网站图片打开慢代码编程基础知识

在后台怎么做网站内链删除的网站做404

关于网站的毕业设计每天做特卖的网站是哪个

阿里云服务器学生机西宁软件优化网站建设

村级网站怎么建设怎样用文本建一个网站

医院网站建设价格低天元建设集团有限公司朱华

学做川菜下什么网站h5自适应网站建设

外贸工具大全网站工业企业利润加快回升

建网站费用十大黄台软件app下载

天津企业做网站住院证明图片在线制作

天迈装饰网站建设项目WordPress模块置顶

单发多框检测（SSD）

模型

[类别预测层]

(边界框预测层)

[连结多尺度的预测]

相关文章：