当前位置: 首页 > news >正文

ICDAR数据集简介

目录

  • 一、ICDAR数据集概述‌
  • ‌二、主流ICDAR数据集详解‌
  • 三、数据集获取途径‌
    • 1.官网注册下载‌
    • 2.学术平台与仓库‌
    • 3.标注工具生成替代数据‌
  • ‌四、关键注意事项‌
    • 1. 标注差异‌
    • 2. 数据合规性‌
    • 3. 领域适配建议‌
  • ‌总结:

一、ICDAR数据集概述‌

ICDAR(文档分析与识别国际会议)是OCR领域的权威会议,每两年发布一次数据集,专注于‌自然场景文本检测与识别‌,涵盖多语言、复杂版式和真实环境挑战。核心特点:

场景多样性‌: 街景、广告牌、票据、手写文档等真实场景图像。
文本复杂性‌: 包含水平、垂直、倾斜、弯曲文本,背景干扰大,部分文本存在遮挡或模糊。
精细标注‌: 提供文本位置坐标(矩形/四边形框)及内容,无法识别的文本标记为###。

‌二、主流ICDAR数据集详解‌

数据集‌‌内容规模‌ ‌特点与应用场景‌‌发布时间‌
ICDAR 2013‌229训练图+233测试图早期标准数据集,适合基础文本检测模型验证2013年
ICDAR 2015‌1000训练图+500测试图多方向文本(水平/垂直/倾斜),复杂背景,EAST等算法基准2015年
ICDAR 2017 MLT‌多语言文本覆盖9种语言,推动多语种OCR技术发展2017年
ICDAR 2019 SROIE‌票据扫描件聚焦发票文本定位与识别,工业场景应用广泛
http://www.dtcms.com/a/240774.html

相关文章:

  • RAID存储技术概述
  • 破解路内监管盲区:免布线低位视频桩重塑停车管理新标准
  • 2025年- H79-Lc187--118. 杨辉三角(找规律)--Java版
  • 初识Docker——容器化革命核心概念
  • LangChain 中的文档加载器(Loader)与文本切分器(Splitter)详解《二》
  • 【Proteus仿真】【32单片机-A010】步进电机控制系统设计
  • 前端与服务器交互以及前端项目组成。
  • 了解Android studio 初学者零基础推荐(4)
  • 计算机视觉一些定义解析
  • RK3588开发笔记-wifi6 SDIO接口rtl8822cs调试笔记
  • 多核处理器系统中内存一致性问题举例
  • PydanticAI快速入门示例
  • React事件处理:如何给按钮绑定onClick点击事件?
  • 运行vue项目报错 errors and 0 warnings potentially fixable with the `--fix` option.
  • L1和L2核心区别 !!--part 2
  • AI书签管理工具开发全记录(十八):书签导入导出
  • 【大模型:知识库管理】--开源工具Ragflow构建知识库
  • 【android bluetooth 框架分析 04】【bt-framework 层详解 1】【BluetoothProperties介绍】
  • 归并排序算法及其在算法中的应用
  • 运动控制--小车的启动和停止算法
  • 1-6 Linux-虚拟机快照(2025.6.9学习篇)
  • WSL从C盘迁移到D盘
  • 客户案例 | 短视频点播企业海外视频加速与成本优化:MediaPackage+Cloudfront 技术重构实践
  • 多元隐函数 偏导公式法 (显示变化 + 隐式变化)
  • 如何快速进行光伏发电量计算?
  • 网络爬虫解析技术与实战代码详解
  • Python应用输入输出函数
  • 【samba】umount:**** target is busy. ubuntu24.04 卸载挂载点
  • Linux离线(zip方式)安装docker
  • T型槽试验平台及其应用