当前位置: 首页 > news >正文

YOLOV8的学习记录(三) 训练各种模型所使用的数据格式区别

        在使用 YOLOv8 训练自己的数据以创建用于目标检测、实例分割、分类、姿态估计等不同任务的模型时,数据格式在图片类型和标签格式等方面既有相同点,也存在一些区别。

图片类型

        对于目标检测、实例分割、分类和姿态估计任务,YOLOv8 支持的常见图片格式基本相同,如 JPEG(.jpg、.jpeg)、PNG(.png)等。这些格式是通用的图像格式,在不同任务中都可以使用。  

        • 特殊情况:通常情况下,图片的格式要求是一致的,但对于某些特殊的姿态估计场景,如果需要额外的深度信息等,可能会涉及到其他特殊格式的数据输入,但这种情况相对较少,一般的 RGB 图像格式就能满足大多数姿态估计任务的需求。    

标签格式

        • 目标检测: YOLOv8 的目标检测标签格式为每行代表一个目标,包含类别索引和边界框信息。

        具体格式为:class x_center y_center width height,其中 class 是目标的类别索引(从 0 开始),x_center、y_center 是边界框中心点相对于图像宽度和高度的归一化坐标,width 和 height 是边界框宽度和高度相对于图像宽度和高度的归一化值。

        例如,对于一张 640x640 的图像,有一个类别索引为 0 的目标,其边界框中心点坐标为 (320, 320),宽度为 100,高度为 200,则对应的标签行应为:0 0.5 0.5 0.15625 0.3125。  

        • 实例分割:实例分割的标签除了类别信息外,还需要包含目标的轮廓信息。标签文件同样是每行代表一个目标,格式为:class x1 y1 x2 y2... xn yn,其中 class 是类别索引,后面跟着目标轮廓上一系列点的归一化坐标(x 和 y 交替出现)。

        例如,一个类别索引为 1 的目标,其轮廓上有三个点 (100, 100)、(200, 100)、(150, 200),对于一张 640x640 的图像,对应的标签行应为:1 0.15625 0.15625 0.3125 0.15625 0.234375 0.3125。  

        • 分类:分类任务的标签相对简单,通常每个图像对应一个标签文件(也可以使用 CSV 等表格形式),标签文件中只包含图像所属的类别名称或类别索引。

        例如,如果使用文件夹结构进行分类数据组织,每个文件夹的名称就是该文件夹内所有图像的类别名称;如果使用标签文件,每行可以只写一个类别索引,如 0 表示图像属于第 0 类。  

        • 姿态估计:姿态估计的标签格式较为复杂,需要包含关键点的信息。标签文件通常包含每个目标的类别索引、关键点坐标以及关键点的可见性信息。

        例如,对于一个人体姿态估计任务,假设每个人体有 17 个关键点,标签文件可能的格式为:class x1 y1 v1 x2 y2 v2... x17 y17 v17,其中 class 是类别索引,xi 和 yi 是第 i 个关键点的归一化坐标,vi 是该关键点的可见性(通常 0 表示不可见,1 表示可见)。  

        综上所述,虽然图片类型在不同任务中基本通用,但标签格式根据任务的不同有明显的差异,在准备数据时需要根据具体的任务需求进行相应的处理和标注。

相关文章:

  • Farewell Go,Hello AI:是时候说再见了
  • AWS Fargate 部署流程图及说明
  • 劳力士(Rolex):蚝式恒动(Oyster Perpetual),潜航者(Submariner)和宇宙计型迪通拿(Daytona)中英双语
  • Vue.js 配置 Babel、Webpack 和 ESLint
  • 矩阵碰一碰发视频技术开发全解析,支持OEM
  • 抖去推与超级编导矩阵系统技术深度对比,矩阵系统支持OEM
  • 【Qt】之【Linux】linux下实现开机自启Qt应用程序
  • Golang面试题一
  • promise捕获错误的方式
  • 网络安全-攻击流程-传输层
  • OceanBase使用ob-loader-dumper导出表报ORA-00600
  • 【DeepSeek】本地PC部署和运行DeepSeek-R1-70b
  • 人工智能知识架构详解
  • 自学Java-面向对象高级(final、单例类、枚举类、抽象类、接口)
  • Leetcode 146 LRU缓存 的三种解法
  • 基于Ollama安装deepseek-r1模型搭建本地知识库(Dify、MaxKb、Open-WebUi、AnythingLLM)
  • 算法1-1 玩具谜题
  • FreeBSD系统使用pyenv安装不同版本python,比如python3.12
  • win11 labelme 汉化菜单
  • 集成测试总结文档
  • 经济日报:政府采购监管篱笆要扎得更牢
  • 俄乌刚谈完美国便筹划与两国领导人通话,目的几何?
  • 茅台总经理到访五粮液:面对白酒行业周期性调整,需要团结一心的合力
  • 我使馆就中国公民和企业遭不公正待遇向菲方持续提出严正交涉
  • 2025年“新时代网络文明公益广告”征集展示活动在沪启动
  • 贵州仁怀通报“正新鸡排鸡腿里全是蛆”:已对同类产品封存送检