当前位置: 首页 > news >正文

PDFMathTranslate:科学 PDF 文件翻译及双语对照工具

PDFMathTranslate:科学 PDF 文件翻译及双语对照工具

在科研和学习过程中,我们经常会遇到大量的英文 PDF 文献,翻译这些文献成为了一项繁琐且耗时的工作。PDFMathTranslate 是一款强大的科学 PDF 文件翻译及双语对照工具,它能够保留公式、图表、目录和注释,支持多种语言和诸多翻译服务,还提供了命令行工具、图形用户界面以及容器化部署等多种使用方式。本文将详细介绍 PDFMathTranslate 的功能、安装方法和使用教程。

一、功能特点

  1. 保留关键元素:能够保留 PDF 文件中的公式、图表、目录和注释,确保翻译后的文档格式完整。
  2. 多语言支持:支持多种语言的翻译,满足不同用户的需求。
  3. 多种翻译服务:集成了多种翻译服务,如 Google、Bing、DeepL 等,用户可以根据自己的需求选择合适的翻译服务。
  4. 多种使用方式:提供命令行工具、图形用户界面和容器化部署等多种使用方式,方便不同场景下的使用。

二、安装方法

PDFMathTranslate 提供了多种安装方法,用户可以根据自己的需求选择合适的安装方式。

1. UV 安装

# 安装 Python (3.10 <= 版本 <= 3.12)
# 安装 uv 工具
pip install uv
# 使用 uv 工具安装 pdf2zh
uv tool install --python 3.12 pdf2zh

2. Windows exe 安装

从 发布页面 下载 pdf2zh-version-win64.zip,解压缩并双击 pdf2zh.exe 运行。

3. 图形用户界面 (GUI) 安装

# 安装 Python (3.10 <= 版本 <= 3.12)
# 安装 pdf2zh 包
pip install pdf2zh
# 在浏览器中开始使用
pdf2zh -i

如果浏览器没有自动启动,请访问 http://localhost:7860/

4. Docker 安装

# 拉取 Docker 镜像
docker pull byaidu/pdf2zh
# 运行 Docker 容器
docker run -d -p 7860:7860 byaidu/pdf2zh

在浏览器中打开 http://localhost:7860/

对于云服务上的 Docker 部署,还提供了多种一键部署的链接:

  • Heroku
  • Render
  • Zeabur
  • Sealos
  • Koyeb

三、使用教程

1. 命令行工具使用

# 执行翻译,文件生成在当前工作目录
pdf2zh document.pdf

2. 图形用户界面使用

打开浏览器,访问 http://localhost:7860/,在界面中上传需要翻译的 PDF 文件,选择翻译服务和目标语言,点击翻译按钮即可开始翻译。

3. 高级使用选项

选项功能示例
-f, -c异常pdf2zh example.pdf -f "(MS.*)"
-cp兼容模式pdf2zh example.pdf --compatible
--share公开链接pdf2zh -i --share
--authorized授权pdf2zh -i --authorized users.txt [auth.html]
--prompt自定义提示pdf2zh --prompt [prompt.txt]
--onnx[使用自定义 DocLayout-YOLO ONNX 模型]pdf2zh --onnx [onnx/model/path]
--serverport[使用自定义 WebUI 端口]pdf2zh --serverport 7860
--dir[批量翻译]pdf2zh --dir /path/to/translate/
--config配置文件pdf2zh --config /path/to/config/config.json

4. 无法安装时的解决方案

  • Python API:可以在其他 Python 程序中使用该程序,详细信息请参考 Python API 文档。
  • HTTP API:可以与已安装该程序的服务器进行通信,详细信息请参考 HTTP API 文档。

四、待办事项

项目还有一些待办事项,如使用基于 DocLayNet 的模型解析布局、修复页面旋转和目录格式、支持非 PDF/A 文件等,感兴趣的开发者可以参与项目的开发。

五、致谢

Immersive Translation 为此项目的活跃贡献者提供每月的专业会员兑换码,详细信息请查看 CONTRIBUTOR_REWARD.md。

六、总结

PDFMathTranslate 是一款功能强大、使用方便的科学 PDF 文件翻译及双语对照工具,它提供了多种安装和使用方式,能够满足不同用户的需求。无论是科研人员、学生还是其他需要翻译 PDF 文献的用户,都可以尝试使用 PDFMathTranslate 来提高翻译效率。

相关文章:

  • HDLBIT-更多Verilog功能(More Verilog Features)
  • 【MCP】魔搭社区MCP服务(高德地图、everything文件搜索)
  • C++中类中const知识应用详解
  • 质控脚本来喽
  • 工具篇-如何在Github Copilot中使用MCP服务?
  • Linux 服务器用 SSH 拉取多个 Git 工程
  • python打卡day22
  • 修改网页标签处文字
  • tar -zxvf jdk-8u212-linux-x64.tar.gz -C /opt/module/这个代码的解释
  • MyBatis 中 ${} 与 #{} 的区别与 SQL 注入防范教程
  • 安装Python和配置开发环境
  • PHP 连接和使用 Kafka 的指南
  • Spring AI 与 Hugging Face 深度集成:打造高效文本生成应用
  • 我们来学mysql -- 安装8.4版本
  • 通信网络编程——JAVA
  • AWS EC2源代码安装valkey命令行客户端
  • PHP 代理服务器:如何在 PHP 中设置代理
  • STC15W408AS计数器
  • 分水岭算法:从逻辑学角度看图像分割的智慧
  • 图像匹配导航定位技术 第 12 章
  • 对话郑永年:我们谈判也是为世界争公义
  • 从“求生”到“生活”:医保纳入创新药让梗阻性肥厚型心肌病患者重拾生活掌控权
  • 教育部基础教育教指委:稳步推进中小学人工智能通识教育
  • 中国目的地·入境游简报006|外国网红游中国启示录
  • 人民时评:莫让“假俗乱”讲解侵蚀“文博热”
  • 中美经贸高层会谈在日内瓦结束,中国代表团将举行发布会