番禺网站建设系统百度网站下载安装
目录
- 一、ICDAR数据集概述
- 二、主流ICDAR数据集详解
- 三、数据集获取途径
- 1.官网注册下载
- 2.学术平台与仓库
- 3.标注工具生成替代数据
- 四、关键注意事项
- 1. 标注差异
- 2. 数据合规性
- 3. 领域适配建议
- 总结:
一、ICDAR数据集概述
ICDAR(文档分析与识别国际会议)是OCR领域的权威会议,每两年发布一次数据集,专注于自然场景文本检测与识别,涵盖多语言、复杂版式和真实环境挑战。核心特点:
场景多样性: 街景、广告牌、票据、手写文档等真实场景图像。
文本复杂性: 包含水平、垂直、倾斜、弯曲文本,背景干扰大,部分文本存在遮挡或模糊。
精细标注: 提供文本位置坐标(矩形/四边形框)及内容,无法识别的文本标记为###。
二、主流ICDAR数据集详解
数据集 | 内容规模 | 特点与应用场景 | 发布时间 |
---|---|---|---|
ICDAR 2013 | 229训练图+233测试图 | 早期标准数据集,适合基础文本检测模型验证 | 2013年 |
ICDAR 2015 | 1000训练图+500测试图 | 多方向文本(水平/垂直/倾斜),复杂背景,EAST等算法基准 | 2015年 |
ICDAR 2017 MLT | 多语言文本 | 覆盖9种语言,推动多语种OCR技术发展 | 2017年 |
ICDAR 2019 SROIE | 票据扫描件 | 聚焦发票文本定位与识别,工业场景应用广泛 |