PDFMathTranslate:科学 PDF 文件翻译及双语对照工具
PDFMathTranslate:科学 PDF 文件翻译及双语对照工具
在科研和学习过程中,我们经常会遇到大量的英文 PDF 文献,翻译这些文献成为了一项繁琐且耗时的工作。PDFMathTranslate 是一款强大的科学 PDF 文件翻译及双语对照工具,它能够保留公式、图表、目录和注释,支持多种语言和诸多翻译服务,还提供了命令行工具、图形用户界面以及容器化部署等多种使用方式。本文将详细介绍 PDFMathTranslate 的功能、安装方法和使用教程。
一、功能特点
- 保留关键元素:能够保留 PDF 文件中的公式、图表、目录和注释,确保翻译后的文档格式完整。
- 多语言支持:支持多种语言的翻译,满足不同用户的需求。
- 多种翻译服务:集成了多种翻译服务,如 Google、Bing、DeepL 等,用户可以根据自己的需求选择合适的翻译服务。
- 多种使用方式:提供命令行工具、图形用户界面和容器化部署等多种使用方式,方便不同场景下的使用。
二、安装方法
PDFMathTranslate 提供了多种安装方法,用户可以根据自己的需求选择合适的安装方式。
1. UV 安装
# 安装 Python (3.10 <= 版本 <= 3.12)
# 安装 uv 工具
pip install uv
# 使用 uv 工具安装 pdf2zh
uv tool install --python 3.12 pdf2zh
2. Windows exe 安装
从 发布页面 下载 pdf2zh-version-win64.zip
,解压缩并双击 pdf2zh.exe
运行。
3. 图形用户界面 (GUI) 安装
# 安装 Python (3.10 <= 版本 <= 3.12)
# 安装 pdf2zh 包
pip install pdf2zh
# 在浏览器中开始使用
pdf2zh -i
如果浏览器没有自动启动,请访问 http://localhost:7860/
。
4. Docker 安装
# 拉取 Docker 镜像
docker pull byaidu/pdf2zh
# 运行 Docker 容器
docker run -d -p 7860:7860 byaidu/pdf2zh
在浏览器中打开 http://localhost:7860/
。
对于云服务上的 Docker 部署,还提供了多种一键部署的链接:
- Heroku
- Render
- Zeabur
- Sealos
- Koyeb
三、使用教程
1. 命令行工具使用
# 执行翻译,文件生成在当前工作目录
pdf2zh document.pdf
2. 图形用户界面使用
打开浏览器,访问 http://localhost:7860/
,在界面中上传需要翻译的 PDF 文件,选择翻译服务和目标语言,点击翻译按钮即可开始翻译。
3. 高级使用选项
选项 | 功能 | 示例 |
---|---|---|
-f , -c | 异常 | pdf2zh example.pdf -f "(MS.*)" |
-cp | 兼容模式 | pdf2zh example.pdf --compatible |
--share | 公开链接 | pdf2zh -i --share |
--authorized | 授权 | pdf2zh -i --authorized users.txt [auth.html] |
--prompt | 自定义提示 | pdf2zh --prompt [prompt.txt] |
--onnx | [使用自定义 DocLayout-YOLO ONNX 模型] | pdf2zh --onnx [onnx/model/path] |
--serverport | [使用自定义 WebUI 端口] | pdf2zh --serverport 7860 |
--dir | [批量翻译] | pdf2zh --dir /path/to/translate/ |
--config | 配置文件 | pdf2zh --config /path/to/config/config.json |
4. 无法安装时的解决方案
- Python API:可以在其他 Python 程序中使用该程序,详细信息请参考 Python API 文档。
- HTTP API:可以与已安装该程序的服务器进行通信,详细信息请参考 HTTP API 文档。
四、待办事项
项目还有一些待办事项,如使用基于 DocLayNet 的模型解析布局、修复页面旋转和目录格式、支持非 PDF/A 文件等,感兴趣的开发者可以参与项目的开发。
五、致谢
Immersive Translation 为此项目的活跃贡献者提供每月的专业会员兑换码,详细信息请查看 CONTRIBUTOR_REWARD.md。
六、总结
PDFMathTranslate 是一款功能强大、使用方便的科学 PDF 文件翻译及双语对照工具,它提供了多种安装和使用方式,能够满足不同用户的需求。无论是科研人员、学生还是其他需要翻译 PDF 文献的用户,都可以尝试使用 PDFMathTranslate 来提高翻译效率。