当前位置: 首页 > news >正文

教程上新|重新定义下一代 OCR:IBM 最新开源 Granite-docling-258M,实现端到端的「结构+内容」统一理解

一直以来,将格式各异的数字文档准确转换为机器可读的结构化数据是一个技术核心挑战。文档布局的复杂多样性、以及其中包含的表格、图片等视觉元素,往往导致传统 OCR 系统的识别准确性难以满足实际需求。现有技术通常依赖于复杂的集成系统,将任务拆解为多个独立子模块,虽在一定程度上有效,但存在优化困难、难以泛化处理各类文档的局限性。

近期,IBM 开源轻量级多模态文档处理模型 Granite-Docling-258M,专为高效文档转换设计,能将文档转换为机器可读格式,同时完整保留布局、表格、公式等元素,实现端到端的全文文档转换。该模型使用 DocTags 格式精准描述文档结构,能与 Docling 库无缝集成,精准捕捉页面中所有元素的内容、结构和空间位置,提供强大的定制化和错误处理能力,适用企业级文档处理,是文档处理领域的强大工具。

此外该模型仅含 258M 参数,在图表识别、全页 OCR、代码识别等方面的性能评估中,均超过了前代的同级参数模型 SmolDocling-256M-Preview。在保持模型参数紧凑的同时,还支持多语言(包括阿拉伯语、中文和日语)处理,为 OCR 提供了最新轻量化、高性能的优化方案。

「Granite-docling-258M:轻量多模态文档处理模型」现已上线至 OpenBayes 公共教程板块,快来体验吧!

教程地址:https://go.openbayes.com/6Lpp9

Demo 运行

01 Demo 运行阶段

1. 登录 OpenBayes.com,在「公共教程」页面,选择「Granite-docling-258M:轻量多模态文档处理模型」教程。

图片

2. 页面跳转后,点击右上角「克隆」,将该教程克隆至自己的容器中。

图片

3. 选择「NVIDIA GeForce RTX 5090」以及「PyTorch」镜像,按照需求选择「按量付费」或「包日/周/月」,点击「继续执行」。新用户使用下方邀请链接注册,可获得 4 小时 RTX 5090 + 5 小时 CPU 的免费时长!

小贝总专属邀请链接(直接复制到浏览器打开):

https://go.openbayes.com/9S6Dr

图片

图片

4. 等待分配资源,首次克隆需等待 3 分钟左右的时间。当状态变为「运行中」后,点击「API 地址」旁边的跳转箭头,即可跳转至 Demo 页面。请注意,用户需在实名认证后才能使用 API 地址访问功能。

图片

02 效果演示

进入 Demo 运行页面后,选择「Upload Image」上传图片,在「Ask new question」提问框中输入问题即可运行。

图片

图片

http://www.dtcms.com/a/482966.html

相关文章:

  • 网络原理 -- HTTP
  • 县级门户网站建设的报告网页游戏网站排名
  • 快速创建无线AP热点
  • CSS级联层样式权重和优先级
  • 免费搭建私人网站修改wordpress后台文字
  • 站内推广的方法网络整合营销传播
  • 国际网站建设的目的网站建设预算知乎
  • 瀚海微SD NAND/TF卡:赋能全场景数据存储,定义高效安全新基准
  • 怎样安全地开启MySQL远程管理权限?
  • 建设局网站查询个人信息wordpress首页文章显示固定分类
  • 网站建设多少钱实惠湘潭磐石网络企业网站建设的目的是什么
  • 知微传感Dkam系列3D相机SDK例程篇:Python设置相机触发模式
  • Java 故障分析与性能调优命令详解(含案例)
  • 【Pytorch】激活函数 Loss 梯度 超详细文本笔记
  • 不同材质金冠钳的力学性能及其对修复体就位影响研究
  • vs2015做网站的后端个人怎么做百度竞价
  • 微信小程序入门学习教程,从入门到精通,项目实战:美妆商城小程序 —— 知识点详解与案例代码 (18)
  • 微信小程序添加水印功能
  • 02_ES索引规范kibana
  • 购物网站建设模板图片价格低的跑车
  • LeetCode hot100:049 字母异位词分组:两种解法的深度解析
  • 网站建设业务前景政务信息网站建设制度
  • 使用C#写微信小程序后端——电商微信小程序
  • C++——vector容器、动态容器
  • C++ 类与对象(下篇)笔记整理
  • 重庆建站服务商漳浦网站开发
  • 深入浅出理解电感:从理论到实践的电路“惯性”元件
  • 分布式事务:基于MQ事务的解决方案详解
  • 无信息先验:贝叶斯分析中的客观基准
  • 公司官网备案流程mysql优化 wordpress