当前位置: 首页 > news >正文

YOLOV1与YOLOV2

YOLO-V1:经典 one-stage 目标检测方法

  1. 核心特性:作为经典 one-stage 方法,其理念是 “You Only Look Once”,将检测问题转化为回归问题,仅靠一个 CNN 即可完成检测,能对视频实时检测,应用广泛。
  2. 核心思想与架构:把输入图像划分为 S×S 网格,预测边界框(Bounding boxes)及置信度(confidence),最终生成检测结果与类别概率图。网络基于 GoogLeNet 修改,共 20 层,输入 448×448×3 图像,输出 7×7×30 的张量。
  3. 关键参数含义:7×7 是最终网格大小,20 代表类别数量,每个网格预测 2 个边界框,每个边界框含(x,y,w,h,c)5 个参数,张量维度按(S×S)×(B×5+C)计算,即 7×7×(2×5+20)=7×7×30。
  4. 损失函数:包含位置误差、置信度误差(分含物体与不含物体两种情况)和分类误差,以此优化模型预测精度。
  5. 优缺点:优点是检测速度快、模型结构简单;缺点是每个网格仅预测一个类别,无法解决物体重叠问题,且小物体检测效果欠佳,边界框长宽比选择单一。

YOLO-V2:更快更强的改进版本

  1. 核心提升:相比 V1,在多个方面进行改进,VOC2007 数据集上 mAP 从 63.4 提升至 78.6,综合性能显著增强。
  2. 关键改进技术
    • 批量归一化(Batch Normalization):舍弃 Dropout,所有卷积层后加入该操作,对输入归一化,使网络收敛更易,提升 2% 的 mAP,如今已成为网络必备处理步骤。
    • 更高分辨率训练:V1 训练用 224×224 图像、测试用 448×448,易致模型 “水土不服”;V2 额外进行 10 次 448×448 图像微调,使用高分辨率分类器后 mAP 提升约 4%。
    • 新网络架构(DarkNet):输入改为 416×416 图像,无全连接层(FC 层),经 5 次降采样得到 13×13 特征图,通过 1×1 卷积减少参数数量。
    • 聚类提取先验框:针对 faster-rcnn 先验框未必适配数据集的问题,用 K-means 聚类(距离按 1-IOU 计算)获取更贴合数据的先验框。
    • 引入 Anchor Box:使预测边界框数量增至 13×13×n,与 faster-rcnn 不同,其先验框不按固定长宽比设定,提升召回率(从 81% 升至 88%)。
    • 直接位置预测(Directed Location Prediction):不直接用偏移量,而是预测相对网格单元的偏移量,通过 σ 函数限制偏移范围,避免收敛问题,提升模型稳定性。
    • 细粒度特征融合(Fine-Grained Features):针对最后一层感受野过大导致小目标信息丢失的问题,融合前期特征,提升小物体检测能力。
    • 多尺度训练(Multi-Scale):训练中每隔一定迭代次数改变输入图像大小,范围为 320×320 至 608×608,增强模型对不同尺寸物体的适应能力。

补充概念:感受野

  1. 定义:特征图上的点所能对应到原始图像的区域大小。
  2. 小卷积核优势:堆叠 3 个 3×3 卷积核(步长 1)与 1 个 7×7 卷积核感受野相同(均为 7×7),但 3 个 3×3 卷积核所需参数(27C²)远少于 7×7 卷积核(49C²),且能更细致提取特征,增加非线性变换,这也是 VGG 网络的设计思路。
http://www.dtcms.com/a/492145.html

相关文章:

  • 什么是python中的functools.partial
  • 旅游网站的市场需求怎么做介绍asp网站后台管理系统密码破解
  • 做网站公司 陕西渭南网站建设上机课
  • 苍穹外卖-购物车部分
  • 《深入浅出数据分析》笔记
  • Docker 完整指南:从入门到企业实战
  • LLM入门笔记:注意力机制与输出预测
  • 网站开发网站开发设计网站建设收费明细
  • 西南能矿建设工程公司网站贵阳网站建设-中国互联
  • 网站建设策划书封面网站做seo有什么作用
  • 网站建设前需求调研表知名网站建设定制
  • 沧州网站seo公司安徽住房与城乡建设门户网站
  • idea2025社区版设置打开的多个文件展示在工具栏下方
  • PCIe协议之 flit 模式 之 速率 vs flit/non-flit vs 编码方式对比汇总
  • JSON_数据传输命名问题
  • 网站网页文案怎么写页面网站建设
  • VS code定时任务设置(mac os)
  • asp.net mvc5 网站开发实践sever2012做网站
  • Java 设计模式——适配器模式:从原理到3种实战的完整指南
  • ios wordpress连接站点wordpress带会员中心
  • 区域气象-大气化学在线耦合模式(WRF-Chem)在大气环境领域实践
  • 廊坊网站建设方案策划asp.net 做网站实例
  • 阿里云购买网站登录docker wordpress安装目录
  • 静态网站添加到织梦手机上编程软件
  • windows文件夹显示不了的解决
  • 北京网站设计知名乐云seo企业邮箱和个人邮箱区别
  • Google提示词白皮书总结(1)
  • aspcms建站视频教学网站cms
  • 网站建设系统优势青岛建设英文网站建设
  • 开发中小学食堂信息化平台:采购系统源码如何快速部署与定制?