当前位置：首页 > news >正文

【Datawhale组队学习202506】YOLO-Master task02 YOLO系列发展线

news 2025/10/11 22:59:59

系列文章目录

`

文章目录

系列文章目录
前言
V1-2015-Joseph Redmon
V2-2016-Joseph Redmon
V3-2018-Joseph Redmon
V4-202004-Chien-Yao Wang
V5-20200609-Ultralytics 公司
V6-20220623-美团
V7-2022-Chien-Yao Wang
V8-20230110-Ultralytics 公司
V9-2024-Chien-Yao Wang
V10-2024-清华大学
V11-20240930-Ultralytics 公司
V12-202502
总结

前言

Datawhale是一个专注于AI与数据科学的开源组织，汇集了众多领域院校和知名企业的优秀学习者，聚合了一群有开源精神和探索精神的团队成员
YOLO-Master
本章学习资料： https://sxwqtaijh4.feishu.cn/docx/Yc40ddMGIo7nOyxSXVZc6KztnYd

`

![[Pasted image 20250620143925.png]]
yolo系列发展时间线，图片来源

YOLO(You Only Look Once）是一种流行的物体检测和图像分割模型，由华盛顿大学的约瑟夫-雷德蒙（Joseph Redmon） 和 阿里-法哈迪（Ali Farhadi） 开发。

V1-2015-Joseph Redmon

发布时间：2015
论文产出： You Only Look Once: Unified, Real-Time Object Detection
代码仓库： https://github.com/pjreddie/darknet
将目标检测简化为单次图像处理任务，从像素回归预测物体的边界框坐标和类别概率。
首次将目标检测任务建模为端到端的回归问题，通过单个 CNN 直接预测边界框坐标和类别概率，跨越了传统两阶段如R-CNN 的区域提议机制。
将输入图像划分为 $\times S$ 网格(如 $\times 7$ )
每个网格单元预测 B 个边界框。（Bounding Boxes） 和 1 个类别概率分布，边界框包含坐标（x, y, w, h） 和 置信度（confidence score）。
设计统一的损失函数，联合优化边界框定位误差、置信度误差和分类误差。

V2-2016-Joseph Redmon

发布时间：2016
论文产出：yolo9000: Better, Faster, Stronger
代码仓库：https://github.com/pjreddie/darknet
在每个卷积层后加入批量归一化（Batch Normalization），提升模型收敛速度、稳定性和泛化能力。
先在 ImageNet 上以 $448 \times 448$ 的分辨率微调分类网络 10 个 epochs，再迁移到检测网络。
引入Faster R-CNN的锚框（Anchor） 概念，移除YOLOv1的全连接层。

V3-2018-Joseph Redmon

**发布时间：**2018
论文产出：yolov3: An Incremental Improvement
**代码仓库：**https://github.com/pjreddie/darknet
引入 3 种不同尺度的预测层分别检测大、中、小目标。
设计更深的骨干网络 Darknet-53（含53层卷积），结合残差连接（Residual Blocks）。

V4-202004-Chien-Yao Wang

V5-20200609-Ultralytics 公司

V6-20220623-美团

V7-2022-Chien-Yao Wang

V8-20230110-Ultralytics 公司

V9-2024-Chien-Yao Wang

V10-2024-清华大学

V11-20240930-Ultralytics 公司

V12-202502

总结

深入了解YOLO的历史。

http://www.dtcms.com/a/255165.html

相关文章：

uniapp开发小程序，导出文件打开并保存，实现过程downloadFile下载，openDocument打开

服务器手动安装并编译R环境库包：PROJ→RGDAL

JS入门——事件与事件绑定

Linux驱动第十章：SPI总线驱动子系统

【unitrix】 3.5 类型级别的比较系统(cmp.rs)

RPC常见问题回答

在 CI/CD 流程中使用 Jenkins 与 Docker 集成

内存的代价：如何正确与 WASM 模块传值交互

大内存对电脑性能有哪些提升

Redis ⑩-持久化 || RDB

算法-每日一题（DAY11）每日温度

【VUE】某时间某空间占用情况效果展示，vue2+element ui实现。场景：会议室占用、教室占用等。

MySQL基础多表查询

uniapp实现像qq消息列表左滑显示右侧操作栏效果

Qt—（Qt线程，Qt进程，，QT与sqlite数据库）

学习华为 ensp 的学习心得体会

SP-VLA：一种用于 VLA 模型加速的联合模型调度和 token 剪枝方法

力扣-136.只出现一次的数字

C语言：二分搜索函数

linux中的数据检索

mysql查询使用`_rowid` 虚拟列

iOS APP上架App Store实践：通过自动化流程和辅助工具高效提

【Python】.pyz：源码与依赖打包

IPv6 | 地址解析 / 地址管理 / 邻居发现协议（NDP）/ 无状态自动配置（SLAAC）

Spring Boot自动配置原理

Spring Boot + MyBatis + Vue：全栈开发中的最佳实践

ASP3605芯片在煤炭设备电源管理中的可靠性设计与应用探索

mapbox进阶，mapbox-gl-draw绘图插件扩展，编辑支持右键取消节点

SAP调用api

创客匠人服务体系解析：知识 IP 变现的全链路赋能模型