当前位置：首页 > news >正文

目标检测学习

news 2025/7/26 15:55:52

RCNN

在这里插入图片描述

默认找出2000个可能存在目标的候选区域 region proposal
将候选区域调整为适合AlexNet网络的输入图像的大小，通过CNN对候选区域提取特征向量，2000个建议区域经过Alexnet生成2000×4096的特征矩阵
将2000×4096的特征向量经过20个类别的svm分类器进行分类，得到[2000，20]的得分矩阵
对2000×20的矩阵进行非极大值抑制，得到目标物体最高的一些建议框
修正bbox，对bbox做回归修正
选择性搜索：将每个像素作为一组，计算每一组的纹理，并将两个最接近的组结合起来。但是为了避免单个区域吞噬其他区域，我们首先对较小的组进行分组。我们继续合并区域，直到所有区域都结合在一起。

训练时候选框筛选

对于所欲的2000个候选区域得分进行筛选，删除小于0.5的
剩余候选框计算真实框和所有候选框的IOU，得到P中每个候选框对应IoU最高的N个中的一个
将计算IoU最高的候选框与其他候选框进行计算IoU，计算结果IoU大于阈值的候选框删除
将筛选出来的候选框，让候选框和真实框做训练，得到四个参数
将回归结果和候选框做计算得到最终结果

SPPNet

将整个图片输入到网络得到一个特征图
通过选择性搜索算法选出2000个候选区域的位置，将这些位置映射到特征图的对应的特征向量
映射过来的特征向量经过SPP层输出固定特征向量大小

SPP

在这里插入图片描述
spp将特征图划分为三张子图，三张子图大小分别为44，22，1，对每个小块进行全局池化
得到（16+4+1）*fc的特征图 fc

fastRcnn

在这里插入图片描述
使用RoI pooling
使用softmax替换svm做分类
分类使用N+1类，多出一个背景类
回归出候选区域位置

RoI pooling

为了加快速度和参数量，相比于spp只使用一个4×4的盒子

faster RCNN

将候选区域的筛选融合到网络中
在这里插入图片描述

http://www.dtcms.com/a/223120.html

相关文章：

Word2Vec 生成词向量

考研系列—操作系统：第三章、内存管理

KVM——CPU独占

FreeRTOS通俗理解指南：基础概念 + 架构+ 内核组件+练手实验

LangChain-Tool和Agent结合智谱AI大模型应用实例2

《数字世界的连接器：计算机网络应用全景解析》

使用flex实现三栏布局，两边固定，中间自适应

智能柜I立控信息I产品介绍

八N皇后问题

LeetCode Hot100(动态规划）

YouTube视频广告指南：类型、投放策略与优劣势解析

传输层核心技术解析

[CSS3]响应式布局

主机号全0，代表网络本身地址；主机号全1，代表广播地址

Spring Boot3.4.1 集成 mybatis plus

Linux | Shell脚本的常用命令

2. JavaScript 基础：变量、运算符、分支

A类地址中最小网络号（0.x.x.x）默认路由 / 无效/未指定地址

基于51单片机的音乐盒键盘演奏proteus仿真

安全帽目标检测

【前端优化】使用speed-measure-webpack-plugin分析前端运行、打包耗时，优化项目

PyCharm接入DeepSeek，实现高效AI编程

【深度剖析】流处理系统性能优化：解决维表JOIN、数据倾斜与数据膨胀问题

响应式原理

LearnOpenGL-笔记-其十

linux 中路由解决方案1

YC-8002型综合变配电监控自动化系统

数据结构与算法之中缀表达式的求值

mysql隐式转换会造成索引失效的原因

外包项目交付后还能怎么加固？我用 Ipa Guard 给 iOS IPA 增加了一层保障