当前位置: 首页 > wzjs >正文

b2c商城网站建设费用长春网站制作推广

b2c商城网站建设费用,长春网站制作推广,已备案个人网站做淘宝客,武汉今天最新消息在PDF解析中,目前主流的开源工具包括Minuer、GOT OCR等。主要都是通过飞桨等OCR套件组装的一套pipeline,或者直接通过VLM解析图像。 #一、 olmOCR是使用VLM进行的端到端的PDF文档解析 二、document-anchoring 与上述的不同在于,olmOCR使用…

在PDF解析中,目前主流的开源工具包括Minuer、GOT OCR等。主要都是通过飞桨等OCR套件组装的一套pipeline,或者直接通过VLM解析图像。

#一、 olmOCR是使用VLM进行的端到端的PDF文档解析
在这里插入图片描述

二、document-anchoring

与上述的不同在于,olmOCR使用了document-anchoring,文档锚定方法。针对PDF中的页码信息、图像信息等元数据和文字,使用pyPDF库进行解析。
在这里插入图片描述
通过在提示词里加入这些文字位置、图像位置、元数据等信息,VLM的幻觉大大减少。
加上位置信息,VLM应该能够定位到具体区域,然后专注于这部分的解析。
仅用页面图像进行提示容易出现未完成的句子,或者在图像数据模糊时产生不忠实的输出。

三、模型微调

数据集:构建了olmOCR-mix-0225数据集
训练:在Qwen2-VL-7B-Instruct上微调
评估:
1.与教师模型GPT-4o计算对齐得分,具体是文档相似性度量,该度量将文档拆分为单词,使用Hirschberg算法对这些单词进行对齐,并计算匹配的比例
2.人类评估:ELO分数
3.下游任务评估

项目:https://github.com/allenai/olmocr

http://www.dtcms.com/wzjs/2999.html

相关文章:

  • 做画册封面的网站长春做网站公司长春seo公司
  • 做时时彩开奖网站犯法吗如何做网络推广运营
  • 中山专业做网站上海网站建设
  • 网站定制北京网站管理系统
  • 可信的免费网站建设关键字是什么意思
  • 网站专业制作做运营需要具备什么能力
  • 开源社区的发展前景seo网站快排
  • 扫二维码做自己网站网站推广应该怎么做?
  • 自己可以做百度网站吗网络优化工程师是做什么的
  • 网址怎么做快捷方式百度seo搜索引擎优化培训
  • 莆田专业网站制作seo应该如何做
  • 得物app开发用了多少钱应用关键词优化
  • 河南专业网站建设公司首选重庆森林粤语完整版在线观看免费
  • 中英文网站建设关键词优化排名查询
  • 怎么做直播网站免费建站网站大全
  • 网站做链接的意义是什么意思保定网站seo
  • 玩具网站建设规划书seo的工作原理
  • 网站建设标准合同百度在线人工客服
  • 网站流量功能更怎么做营销型网站策划
  • 可以做卡通动画的网站想学网络营销怎么学
  • 婚介网站建设网站制作公司排名
  • ui设计交付物都包含哪些aso优化什么意思
  • 网站实现语言转换技术上该怎么做鸡西seo
  • 全国企业信用信息公示系统河南搜索引擎优化技术有哪些
  • iosapp做网站搜索引擎调词工具哪个好
  • 深圳外贸网站建设口报关互联网运营推广
  • 门户网站做市场营销推广活动方案
  • 0基础网站建设教程视频全球外贸采购网
  • 怎样做博客网站cpa广告联盟
  • 企业网站的建设与维护网站推广优化设计方案