当前位置: 首页 > news >正文

目标检测学习

RCNN

在这里插入图片描述

  1. 默认找出2000个可能存在目标的候选区域 region proposal
  2. 将候选区域调整为适合AlexNet网络的输入图像的大小,通过CNN对候选区域提取特征向量,2000个建议区域经过Alexnet生成2000×4096的特征矩阵
  3. 将2000×4096的特征向量经过20个类别的svm分类器进行分类,得到[2000,20]的得分矩阵
  4. 对2000×20的矩阵进行非极大值抑制,得到目标物体最高的一些建议框
  5. 修正bbox,对bbox做回归修正
    选择性搜索:将每个像素作为一组,计算每一组的纹理,并将两个最接近的组结合起来。但是为了避免单个区域吞噬其他区域,我们首先对较小的组进行分组。我们继续合并区域,直到所有区域都结合在一起。

训练时候选框筛选

  1. 对于所欲的2000个候选区域得分进行筛选,删除小于0.5的
  2. 剩余候选框计算真实框和所有候选框的IOU,得到P中每个候选框对应IoU最高的N个中的一个
  3. 将计算IoU最高的候选框与其他候选框进行计算IoU,计算结果IoU大于阈值的候选框删除
  4. 将筛选出来的候选框,让候选框和真实框做训练,得到四个参数
  5. 将回归结果和候选框做计算得到最终结果

SPPNet

  1. 将整个图片输入到网络得到一个特征图
  2. 通过选择性搜索算法选出2000个候选区域的位置,将这些位置映射到特征图的对应的特征向量
  3. 映射过来的特征向量经过SPP层输出固定特征向量大小

SPP

在这里插入图片描述
spp将特征图划分为三张子图,三张子图大小分别为44,22,1,对每个小块进行全局池化
得到(16+4+1)*fc的特征图 fc

fastRcnn

在这里插入图片描述
使用RoI pooling
使用softmax替换svm做分类
分类使用N+1类,多出一个背景类
回归出候选区域位置

RoI pooling

为了加快速度和参数量,相比于spp只使用一个4×4的盒子

faster RCNN

将候选区域的筛选融合到网络中
在这里插入图片描述

相关文章:

  • Word2Vec 生成词向量
  • 考研系列—操作系统:第三章、内存管理
  • KVM——CPU独占
  • FreeRTOS通俗理解指南:基础概念 + 架构+ 内核组件+练手实验
  • LangChain-Tool和Agent结合智谱AI大模型应用实例2
  • 《数字世界的连接器:计算机网络应用全景解析》
  • 使用flex实现三栏布局,两边固定,中间自适应
  • 智能柜I立控信息I产品介绍
  • 八N皇后问题
  • LeetCode Hot100(动态规划)
  • YouTube视频广告指南:类型、投放策略与优劣势解析
  • 传输层核心技术解析
  • [CSS3]响应式布局
  • 主机号全0,代表网络本身地址; 主机号全1,代表广播地址
  • Spring Boot3.4.1 集成 mybatis plus
  • Linux | Shell脚本的常用命令
  • 2. JavaScript 基础:变量、运算符、分支
  • A类地址中最小网络号(0.x.x.x) 默认路由 / 无效/未指定地址
  • 基于51单片机的音乐盒键盘演奏proteus仿真
  • 安全帽目标检测
  • 手机云电脑/seo下拉优化
  • 西安网站优化维护/网络推广策划方案
  • 怎样做网站测评/关键词分析工具网站
  • 二级学院网站建设自评报告/上海网站排名seo公司
  • 建筑单位资质/北京网站优化服务商
  • 什么网站做视频最赚钱/漯河seo推广