【Datawhale组队学习202506】YOLO-Master task02 YOLO系列发展线
系列文章目录
`
文章目录
- 系列文章目录
- 前言
- V1-2015-Joseph Redmon
- V2-2016-Joseph Redmon
- V3-2018-Joseph Redmon
- V4-202004-Chien-Yao Wang
- V5-20200609-Ultralytics 公司
- V6-20220623-美团
- V7-2022-Chien-Yao Wang
- V8-20230110-Ultralytics 公司
- V9-2024-Chien-Yao Wang
- V10-2024-清华大学
- V11-20240930-Ultralytics 公司
- V12-202502
- 总结
前言
- Datawhale是一个专注于AI与数据科学的开源组织,汇集了众多领域院校和知名企业的优秀学习者,聚合了一群有开源精神和探索精神的团队成员
- YOLO-Master
- 本章学习资料: https://sxwqtaijh4.feishu.cn/docx/Yc40ddMGIo7nOyxSXVZc6KztnYd
`
![[Pasted image 20250620143925.png]]
yolo系列发展时间线,图片来源
YOLO(You Only Look Once)是一种流行的物体检测和图像分割模型,由华盛顿大学的约瑟夫-雷德蒙(Joseph Redmon) 和 阿里-法哈迪(Ali Farhadi) 开发。
V1-2015-Joseph Redmon
-
发布时间
:2015 -
论文产出:
You Only Look Once: Unified, Real-Time Object Detection -
代码仓库:
https://github.com/pjreddie/darknet -
将目标检测简化为单次图像处理任务,从像素回归预测物体的边界框坐标和类别概率。
-
首次将目标检测任务建模为端到端的回归问题,通过单个 CNN 直接预测边界框坐标和类别概率,跨越了传统两阶段 如R-CNN 的区域提议机制。
-
将输入图像划分为 S × S S \times S S×S 网格(如 7 × 7 7 \times 7 7×7)
-
每个网格单元预测 B 个边界框。(Bounding Boxes) 和 1 个类别概率分布,边界框包含坐标(x, y, w, h) 和 置信度(confidence score)。
-
设计统一的损失函数,联合优化边界框定位误差、置信度误差和分类误差。
V2-2016-Joseph Redmon
-
发布时间
:2016 -
论文产出
:yolo9000: Better, Faster, Stronger -
代码仓库:https://github.com/pjreddie/darknet
-
在每个卷积层后加入批量归一化(Batch Normalization),提升模型收敛速度、稳定性和泛化能力。
-
先在
ImageNet
上以 448 × 448 448 \times 448 448×448 的分辨率微调分类网络 10 个 epochs,再迁移到检测网络。 -
引入Faster R-CNN的锚框(Anchor) 概念,移除YOLOv1的全连接层。
V3-2018-Joseph Redmon
-
**发布时间:**2018
-
论文产出:yolov3: An Incremental Improvement
-
**代码仓库:**https://github.com/pjreddie/darknet
-
引入 3 种不同尺度的预测层分别检测大、中、小目标。
-
设计更深的骨干网络 Darknet-53(含53层卷积),结合残差连接(Residual Blocks)。
V4-202004-Chien-Yao Wang
V5-20200609-Ultralytics 公司
V6-20220623-美团
V7-2022-Chien-Yao Wang
V8-20230110-Ultralytics 公司
V9-2024-Chien-Yao Wang
V10-2024-清华大学
V11-20240930-Ultralytics 公司
V12-202502
总结
- 深入了解YOLO的历史。