当前位置: 首页 > news >正文

扩展阅读:数据标注的两种类型 - 矩形框标注 和 关键点标注

在计算机视觉和人工智能数据标注中,矩形框标注(Bounding Box Annotation)和关键点标注(Keypoint Annotation)是两种常见且重要的标注类型,分别用于不同的任务目标。本文将详细解释它们的定义、用途、格式和典型应用场景:


一、矩形框标注(Bounding Box Annotation)

定义

用一个矩形框(通常是轴对齐的,即边与图像坐标轴平行)包围图像中的目标对象。

常见格式

  1. (x_min, y_min, x_max, y_max)

    • 左上角 (x_min, y_min),右下角 (x_max, y_max)
    • 常见于 CSV、Pascal VOC、自定义数据集
  2. (x, y, width, height)

    • (x, y) 是左上角坐标,widthheight 是宽高
    • COCO 格式采用此表示

典型应用场景

  • 人脸检测(框出人脸区域)
  • 行人检测
  • 车辆检测
  • 通用目标检测(如 YOLO、Faster R-CNN 的输入)

示例(人脸检测)

image.jpg, 100, 80, 200, 220, face

表示在 image.jpg 中,从 (100,80) 到 (200,220) 的矩形区域内有一张人脸。


二、关键点标注(Keypoint Annotation)

定义

标注目标对象上的特定语义点(landmarks),每个点有明确的含义和固定名称。

格式

通常表示为:

  • (x, y) 坐标 + 可见性标志(可选)
  • 每个关键点有预定义的名称或索引
常见表示方式:
  1. 字典形式(便于阅读):

    {"left_eye": [120, 100],"right_eye": [180, 100],"nose": [150, 140],"mouth_left": [130, 180],"mouth_right": [170, 180]
    }
    
  2. 列表形式(COCO 格式):

    "keypoints": [120, 100, 2, 180, 100, 2, 150, 140, 2, 130, 180, 2, 170, 180, 2]
    
    • 每 3 个值为一组:[x, y, v]
    • v 表示可见性:
      • 0 = 未标注
      • 1 = 标注但不可见(如被遮挡)
      • 2 = 可见

典型应用场景

  • 人脸关键点检测(5点、68点、106点等)→ 用于美颜、活体检测、3D 重建
  • 人体姿态估计(如 COCO 的 17 个关节点)→ 用于动作识别、健身指导
  • 手部关键点 → 手势识别
  • 动物姿态分析

示例(人脸 5 点)

关键点坐标 (x, y)
left_eye(120, 100)
right_eye(180, 100)
nose(150, 140)
left_mouth(130, 180)
right_mouth(170, 180)

三、两者对比总结

特性矩形框标注(Bounding Box)关键点标注(Keypoint)
目的定位目标位置定位目标的精细结构/语义部位
输出粒度粗粒度(整个对象)细粒度(特定点)
标注复杂度低(只需画框)高(需精确定位多个点)
典型任务目标检测姿态估计、人脸对齐、形变分析
是否依赖类别是(需指定类别如 “face”)通常与类别绑定(如 “person” 的关节点)
是否可组合使用√ 常与关键点联合使用(如人脸检测+5点)√ 通常在检测框内进行关键点回归

💡 实际应用中,两者常结合使用
先用矩形框检测出人脸区域,再在该区域内回归关键点坐标(两阶段 pipeline)。


四、常用工具支持

工具矩形框关键点输出格式支持
Labelme√(Point 工具)JSON(需后处理转 COCO)
CVATCOCO、Pascal VOC 等
LabelImgxPascal VOC、YOLO
RoboflowCOCO、YOLO、TFRecord 等

五、如何选择?

  • 如果你只需要知道“有没有人脸”以及“在哪” → 用 矩形框标注
  • 如果你需要知道眼睛、鼻子、嘴巴的具体位置(如做人脸对齐、表情分析)→ 必须用 关键点标注
  • 如果两者都需要(如工业级人脸系统)→ 同时标注矩形框 + 关键点(COCO 格式天然支持)。

总结

  • 矩形框标注 = “目标在哪里”
  • 关键点标注 = “目标的结构细节在哪”

两者互补,共同构成现代视觉感知系统的基础数据。

http://www.dtcms.com/a/550977.html

相关文章:

  • 小杰-大模型(one)——大模型的概念与历程。
  • 为什么用开源建站第三方商城网站开发
  • 政务移动门户网站建设方案php开源cms
  • 重庆建设教育网站昭通网站建设
  • 企业申请网站建设请示3秒钟自动跳转网页
  • 加强网站建设的措施网站营销推广应该怎么做
  • 做网站看网页效果999网站免费
  • TypeScript 中的 args 详解,和 arguments 有什么不同?
  • 鞍山网站设计公司免费刷推广链接的软件
  • 做网站用什么语言简单制作动画的网站
  • 三坐标同轴度测量方法
  • 汕头多语种网站制作俄罗斯做牙网站
  • 仿织梦小说网站源码浙江网
  • 做教程网站如何查用户搜索深圳福田区十强企业
  • 二叉搜索树学习笔记
  • 建设部安全员证书查询网站妇科在线医生免费咨询
  • 网站建设zrhskjseo如何优化排名
  • 河北建设执业资格注册中心网站中国十大杰出建筑师
  • 【Rust编程】ORM框架Diesel
  • 呢图网站场建设封面桔子摄影
  • 设计网站大全湖南岚鸿网站大全网站大事记时间轴折叠
  • Redis的内存淘汰策略
  • 网站 制作 工具个人网站 备案 类型
  • 网站建设公司排名打不开wordpress网址
  • 装修公司免费网站模版吴江建设工程招标中心网站
  • 影石开奖,有点香
  • 苏宁推客如何做网站东莞互联网营销网站建设
  • 做网站和软件有区别吗深圳龙岗区网站建设
  • 地方网站怎么做推广wordpress 后台反应
  • HTTPS 相关知识