当前位置: 首页 > wzjs >正文

wordpress tax input网络推广优化平台

wordpress tax input,网络推广优化平台,专业做网站的公司有没有服务器,网站开发雇佣平台Dolphin (Document Image Parsing via Heterogeneous Anchor Prompting)是一种遵循“先分析后解析”范式的新型多模态文档图像解析模型。本仓库包含Dolphin的演示代码与预训练模型。 📑 概述 文档图像解析因其包含文本段落、图表、公式和表格等复杂交织的元素而具…

Dolphin (Document Image Parsing via Heterogeneous Anchor Prompting)是一种遵循“先分析后解析”范式的新型多模态文档图像解析模型。本仓库包含Dolphin的演示代码与预训练模型。

📑 概述

文档图像解析因其包含文本段落、图表、公式和表格等复杂交织的元素而具有挑战性。Dolphin通过两阶段方法应对这些挑战:

  1. 🔍 第一阶段:通过生成自然阅读顺序的元素序列,实现全面的页面级布局分析
  2. 🧩 第二阶段:利用异构锚点和任务特定提示,高效并行解析文档元素

在这里插入图片描述
海豚系统在各类页面级和元素级解析任务中均展现出优异性能,同时通过轻量级架构和并行解析机制确保了卓越的运行效率。

模型架构

海豚系统采用基于Transformer的视觉-编码器-解码器架构:

  • 视觉编码器:基于Swin Transformer,用于从文档图像中提取视觉特征
  • 文本解码器:基于MBart,用于从视觉特征解码文本
  • 基于提示的交互界面:通过自然语言提示控制解析任务

该模型以Hugging Face的VisionEncoderDecoderModel形式实现,便于与Transformers生态系统集成。

🛠️ 安装

  1. 克隆repo
git clone https://github.com/ByteDance/Dolphin.git
cd Dolphin
  1. 安装依赖项:
pip install -r requirements.txt
  1. 通过以下任一选项下载预训练模型:

选项A:原始模型格式(基于配置)

从百度云或Google Drive下载,并将它们放入./checkpoints文件夹。

选项B:Hugging Face模型格式

访问我们的Huggingface模型页面,或通过以下命令下载模型:

# 从Hugging Face Hub下载模型
git lfs install
git clone https://huggingface.co/ByteDance/Dolphin ./hf_model
# 或使用Hugging Face CLI
huggingface-cli download ByteDance/Dolphin --local-dir ./hf_model

⚡ 推理

Dolphin提供两种推理框架,支持两种解析粒度:

  • 页面级解析:将整个文档图像解析为结构化的JSON和Markdown格式
  • 元素级解析:解析单个文档元素(文本、表格、公式)

📄 页面级解析

使用原始框架(基于配置)

# Process a single document image
python demo_page.py --config ./config/Dolphin.yaml --input_path ./demo/page_imgs/page_1.jpeg --save_dir ./results# Process all document images in a directory
python demo_page.py --config ./config/Dolphin.yaml --input_path ./demo/page_imgs --save_dir ./results# Process with custom batch size for parallel element decoding
python demo_page.py --config ./config/Dolphin.yaml --input_path ./demo/page_imgs --save_dir ./results --max_batch_size 8

Hugging Face Framework

# Process a single document image
python demo_page_hf.py --model_path ./hf_model --input_path ./demo/page_imgs/page_1.jpeg --save_dir ./results# Process all document images in a directory
python demo_page_hf.py --model_path ./hf_model --input_path ./demo/page_imgs --save_dir ./results# Process with custom batch size for parallel element decoding
python demo_page_hf.py --model_path ./hf_model --input_path ./demo/page_imgs --save_dir ./results --max_batch_size 16

🧩 元素级解析
使用原始框架(基于配置)

# Process a single table image
python demo_element.py --config ./config/Dolphin.yaml --input_path ./demo/element_imgs/table_1.jpeg --element_type table# Process a single formula image
python demo_element.py --config ./config/Dolphin.yaml --input_path ./demo/element_imgs/line_formula.jpeg --element_type formula# Process a single text paragraph image
python demo_element.py --config ./config/Dolphin.yaml --input_path ./demo/element_imgs/para_1.jpg --element_type text

Hugging Face Framework

# Process a single table image
python demo_element_hf.py --model_path ./hf_model --input_path ./demo/element_imgs/table_1.jpeg --element_type table# Process a single formula image
python demo_element_hf.py --model_path ./hf_model --input_path ./demo/element_imgs/line_formula.jpeg --element_type formula# Process a single text paragraph image
python demo_element_hf.py --model_path ./hf_model --input_path ./demo/element_imgs/para_1.jpg --element_type text

🌟 主要特点

  • 🔄 基于单一视觉语言模型的两阶段分析-解析方法
  • 📊 在文档解析任务上表现优异
  • 🔍 自然阅读顺序的元素序列生成
  • 🧩 针对不同文档元素的异构锚点提示
  • ⏱️ 高效的并行解析机制
  • 🤗 支持Hugging Face Transformers以便更轻松集成

💖 致谢

我们要感谢以下开源项目为本工作提供的灵感和参考:

  • Donut
  • Nougat
  • GOT
  • MinerU
  • Swin
  • Hugging Face Transformers
http://www.dtcms.com/wzjs/22589.html

相关文章:

  • 鞍山信息网便民信息百度爱采购优化排名软件
  • 做简历的网站都有哪些内容网络营销的基本方法
  • 做网站后期维护做一个公司网站需要多少钱
  • 网站建设要什么知识南昌seo优化公司
  • 校园网站建设标书文娱热搜榜
  • 政府网站建设工作总结6seo长尾快速排名
  • 一般纳税人企业所得税怎么征收福清seo
  • 做外贸什么网站百度问答平台
  • 网站用的什么数据库手机制作网站的软件
  • 自己做视频网站会不会追究版权长春网站建设团队
  • 网站内容建设和管理百度竞价广告收费标准
  • 台州企业网站搭建厂家torrentkitty磁力天堂
  • 平度168网站建设深圳seo优化培训
  • 028网站建设工作室网站运营维护的基本工作
  • 个人网站取什么域名好网上竞价
  • 洛阳网站建设内容西藏自治区seo 标题 关键词优化
  • 做彩票网站郑州seo团队
  • 网站友情链接怎么添加商城网站建设
  • 广州网站建设定制百度app安卓版下载
  • 网络推广 公司 200个网站总排行榜总点击榜总收藏榜
  • 万网网站备案怎么分析一个网站seo
  • 网站建设怎样设置动态背景免费的客户资源怎么找
  • 做企业网站怎么收费的华与华营销策划公司
  • 外贸家具网站seo的中文含义是什么意思
  • 做淘宝banner的网站软文推广代理平台
  • 济南做网站xywlcn信阳seo推广
  • 龙岗建网站公司广州优化防控措施
  • 物联网公司排名国内跟我学seo
  • 南昌网站建设专业公司全网营销方案
  • 山东seo网站网站运营是做什么的