当前位置: 首页 > news >正文

图像识别技术与应用-YOLO

1 YOLO-V1

YOLO-V1它是经典的one-stage方法,You Only Look Once,名字就已经说明了一切!把检测问题转化成回归问题,一个CNN就搞定了!也可以对视频进行实时检测,应用领域非常广!

YOLO-V1诞生与2015年

优点

1)快速,简单

缺点

1)每个Cell只预测一个类别,如果重叠无法解决

2)小物体检测效果一般,长宽比可选的但单一

核心思想:把目标检测任务当作一个回归问题处理

网络架构

损失函数

2 YOLO-V2

优点:比YOLO-V1更快,更强,更大的分辨率

YOLO-V2-Batch Normalization

V2版本舍弃Dropout,卷积后全部加入Batch Normalization

网络的每一层的输入都做了归一化,收敛相对更容易

经过Batch Normalization处理后的网络会提升2%的mAP

从现在的角度来看,Batch Normalization已经成网络必备处理

网络结构

DarkNet,实际输入为416*416,没有FC层,5次降采样(13*13),1*1卷积节省了很多参数

YOLO-V2-聚类提取先验框

特点:它通过对训练集中标注的目标框尺寸等信息进行聚类分析,自动确定合适的先验框尺寸,使得先验框能更好地匹配不同数据集中目标的实际形状和大小分布情况,进而提升目标检测的精度,让网络在预测时更容易收敛到合适的边界框

YOLO-V2-Anchor Box

1)通过引入anchor boxes,使得预测的box数量更多(13*13*n)

2)跟faster-rcnn系列不同的是先验框并不是直接按照长宽固定比给定

感受野

简介:概述来说就是特征图上的点能看到原始图像多大区域。

YOLO-V2-Fine-Grained Features

如果最后一层时感受野太大了,小目标可能丢失了,需融合之前的特征。

 

 

 

 

 

相关文章:

  • AI日报 - 2025年3月13日
  • Spring Boot 整合 Druid 并开启监控
  • 软件版本号设计
  • IEC61850标准下MMS 缓存报告控制块 ResvTms详细解析
  • 十种处理权重矩阵的方法及数学公式
  • python-leetcode 49.二叉树中的最大路径和
  • 【ES6】ES6中的类
  • 侯捷C++课程学习笔记:构造函数那些事儿(四)
  • 微信h5环境使用开放标签(wx-open-launch-weapp)打开三方小程序
  • 【商城实战(25)】解锁UniApp移动端适配秘籍,打造完美商城体验
  • 第一章:Tailwind CSS基础与项目设置 - 第一节:Tailwind CSS入门 - 核心理念与工作流
  • BGP 规划问题、路由黑洞与环路
  • 面试之《前端常见的设计模式》
  • Quantum Computing:量子计算如何改变世界
  • 行为模式---策略模式
  • C++多线程编程 3.互斥量、互斥锁
  • 百某田网任务脚本
  • c语言经典案例题
  • Insar结合ISCE2,某一个文件进行并行-stackSentinel.py
  • 【Maven教程与实战案例】
  • 专访|《内沙》导演杨弋枢:挽留终将失去的美好
  • 上海比常年平均时间提前12天入夏,明天最高气温可达33℃
  • 媒体:中国女排前队长朱婷妹妹被保送浙大受质疑,多方回应
  • 李峰已任上海青浦区委常委
  • 《求是》杂志发表习近平总书记重要文章《锲而不舍落实中央八项规定精神,以优良党风引领社风民风》
  • 中日东三省问题的源起——《1905年东三省事宜谈判笔记》解题