当前位置: 首页 > news >正文

coco格式

COCO(Common Objects in Context)格式是一种广泛用于图像识别和分割任务的数据格式,尤其是在目标检测、语义分割等任务中。COCO格式的核心包括以下几个部分:

  1. images: 包含图像的基本信息(如文件名、大小、ID等)。
  2. annotations: 包含每个目标的标注信息,如边界框、类别、分割掩码等。
  3. categories: 定义所有类别的信息。
  4. licenses: 图片的授权信息(可选)。
  5. info: 数据集的基本信息(可选)。

COCO格式的JSON文件大致结构如下:

{
  "info": {
    "year": 2025,
    "version": "1.0",
    "description": "COCO-style Dataset",
    "contributor": "User",
    "date_created": "2025-02-21"
  },
  "images": [
    {
      "id": 1,
      "width": 640,
      "height": 480,
      "file_name": "image1.jpg",
      "license": 1,
      "flickr_url": "http://example.com/image1",
      "coco_url": "http://example.com/image1"
    }
  ],
  "annotations": [
    {
      "id": 1,
      "image_id": 1,
      "category_id": 1,
      "bbox": [100, 150, 200, 250],  // [x, y, width, height]
      "area": 50000,
      "segmentation": [[100, 150, 100, 250, 300, 250, 300, 150]],  // Polygon segmentation
      "iscrowd": 0
    }
  ],
  "categories": [
    {
      "id": 1,
      "name": "cat",
      "supercategory": "animal"
    }
  ]
}

主要字段解释:

  • images:
    • id: 图像的唯一标识符。
    • file_name: 图像文件名。
    • width, height: 图像的宽高。
    • license: 图片的授权ID。
  • annotations:
    • id: 标注的唯一标识符。
    • image_id: 该标注对应的图像ID。
    • category_id: 目标类别ID。
    • bbox: 边界框的坐标 [x, y, width, height]
    • area: 目标区域的面积。
    • segmentation: 分割掩码(可以是多边形的坐标点数组)。
    • iscrowd: 是否为拥挤对象,0表示没有,1表示是。
  • categories:
    • id: 类别的唯一标识符。
    • name: 类别名称。
    • supercategory: 类别的父类别。

这种格式便于进行目标检测、图像分割等任务的标注和数据管理。

相关文章:

  • Elasticsearch常用的查询条件
  • 记录一次 ALG 的处理过程
  • Ubuntu24.04LTS的下载安装超细图文教程(VMware虚拟机及正常安装)
  • 网络安全域管理 网络安全管理体系
  • python的多线程机制和构造
  • 代码随想录算法训练营第四十五天| 动态规划08
  • 大模型产品Deepseek(八)、数据嵌入+知识库管理+联网搜索,实现精准的知识查询
  • 为什么 MySQL 选择使用 B+ 树作为索引结构?MySQL 索引的最左前缀匹配原则是什么?MySQL 三层 B+ 树能存多少数据?
  • [OD E 100] 生成哈夫曼树
  • Java 字符串
  • 51c大模型~合集69
  • 最新版本Exoplayer扩展FFmpeg音频软解码保姆级教程
  • 简单易懂,解析Go语言中的Map
  • Unity 适用于单机游戏的红点系统(前缀树 | 数据结构 | 设计模式 | 算法 | 含源码)
  • postman调用ollama的api
  • REACT学习DAY02(恨连接不上服务器)
  • 垃圾回收知识点
  • 3.12 企业级智能文档引擎:从技术手册到产品报告的全链路自动化实践指南
  • 超简单理解KMP算法(最长公共前后缀next数组、合并主子串、子串偏移法)
  • QT 引入Quazip和Zlib源码工程到项目中,无需编译成库,跨平台,压缩进度
  • 种植耐旱作物、启动备用水源,甘肃各地多举措应对旱情
  • 当“诈骗诱饵”盯上短剧
  • 蒲慕明院士:未来数十年不是AI取代人,而是会用AI的人取代不会用的
  • 李成钢:近期个别经济体实施所谓“对等关税”,严重违反世贸组织规则
  • 350种咖啡主题图书集结上海,20家参展书店买书送咖啡
  • 艺术稀缺性和价值坚守如何构筑品牌差异化壁垒?从“心邸”看CINDY CHAO的破局之道