当前位置: 首页 > news >正文

【Datawhale组队学习202506】YOLO-Master task02 YOLO系列发展线

系列文章目录


`

文章目录

  • 系列文章目录
  • 前言
  • V1-2015-Joseph Redmon
  • V2-2016-Joseph Redmon
  • V3-2018-Joseph Redmon
  • V4-202004-Chien-Yao Wang
  • V5-20200609-Ultralytics 公司
  • V6-20220623-美团
  • V7-2022-Chien-Yao Wang
  • V8-20230110-Ultralytics 公司
  • V9-2024-Chien-Yao Wang
  • V10-2024-清华大学
  • V11-20240930-Ultralytics 公司
  • V12-202502
  • 总结


前言

  • Datawhale是一个专注于AI与数据科学的开源组织,汇集了众多领域院校和知名企业的优秀学习者,聚合了一群有开源精神和探索精神的团队成员
  • YOLO-Master
  • 本章学习资料: https://sxwqtaijh4.feishu.cn/docx/Yc40ddMGIo7nOyxSXVZc6KztnYd

`

![[Pasted image 20250620143925.png]]
yolo系列发展时间线,图片来源

YOLO(You Only Look Once)是一种流行的物体检测和图像分割模型,由华盛顿大学的约瑟夫-雷德蒙(Joseph Redmon)阿里-法哈迪(Ali Farhadi) 开发。


V1-2015-Joseph Redmon

  • 发布时间:2015

  • 论文产出: You Only Look Once: Unified, Real-Time Object Detection

  • 代码仓库: https://github.com/pjreddie/darknet

  • 将目标检测简化为单次图像处理任务,从像素回归预测物体的边界框坐标和类别概率。

  • 首次将目标检测任务建模为端到端的回归问题,通过单个 CNN 直接预测边界框坐标和类别概率,跨越了传统两阶段 如R-CNN 的区域提议机制。

  • 将输入图像划分为 S × S S \times S S×S 网格(如 7 × 7 7 \times 7 7×7)

  • 每个网格单元预测 B 个边界框。(Bounding Boxes)1 个类别概率分布,边界框包含坐标(x, y, w, h)置信度(confidence score)

  • 设计统一的损失函数,联合优化边界框定位误差置信度误差分类误差


V2-2016-Joseph Redmon

  • 发布时间:2016

  • 论文产出:yolo9000: Better, Faster, Stronger

  • 代码仓库:https://github.com/pjreddie/darknet

  • 在每个卷积层后加入批量归一化(Batch Normalization),提升模型收敛速度、稳定性和泛化能力。

  • 先在 ImageNet 上以 448 × 448 448 \times 448 448×448 的分辨率微调分类网络 10 个 epochs,再迁移到检测网络。

  • 引入Faster R-CNN的锚框(Anchor) 概念,移除YOLOv1的全连接层。


V3-2018-Joseph Redmon

  • **发布时间:**2018

  • 论文产出:yolov3: An Incremental Improvement

  • **代码仓库:**https://github.com/pjreddie/darknet

  • 引入 3 种不同尺度的预测层分别检测大、中、小目标。

  • 设计更深的骨干网络 Darknet-53(含53层卷积),结合残差连接(Residual Blocks)。


V4-202004-Chien-Yao Wang


V5-20200609-Ultralytics 公司


V6-20220623-美团


V7-2022-Chien-Yao Wang


V8-20230110-Ultralytics 公司


V9-2024-Chien-Yao Wang


V10-2024-清华大学


V11-20240930-Ultralytics 公司


V12-202502

总结

  • 深入了解YOLO的历史。

相关文章:

  • uniapp开发小程序,导出文件打开并保存,实现过程downloadFile下载,openDocument打开
  • 服务器手动安装并编译R环境库包:PROJ→RGDAL
  • JS入门——事件与事件绑定
  • Linux驱动第十章:SPI总线驱动子系统
  • 【unitrix】 3.5 类型级别的比较系统(cmp.rs)
  • RPC常见问题回答
  • 在 CI/CD 流程中使用 Jenkins 与 Docker 集成
  • 内存的代价:如何正确与 WASM 模块传值交互
  • 大内存对电脑性能有哪些提升
  • Redis ⑩-持久化 || RDB
  • 算法-每日一题(DAY11)每日温度
  • 【VUE】某时间某空间占用情况效果展示,vue2+element ui实现。场景:会议室占用、教室占用等。
  • MySQL基础多表查询
  • uniapp实现像qq消息列表左滑显示右侧操作栏效果
  • Qt—(Qt线程,Qt进程,,QT与sqlite数据库)
  • 学习华为 ensp 的学习心得体会
  • SP-VLA:一种用于 VLA 模型加速的联合模型调度和 token 剪枝方法
  • 力扣-136.只出现一次的数字
  • C语言:二分搜索函数
  • linux中的数据检索
  • 佛山格尔做网站的公司/网页做推广
  • 网站制作电话多少/网站建设推广多少钱
  • 用别人备案域名做违法网站/最近一周的重大新闻
  • 西宁高端网站建设/千峰培训多少钱
  • 做网站需要写配置文件吗/网店代运营诈骗
  • win7家用电脑做网站服务器/百度点击软件还有用吗