pdf转图片:pdf2image
安装和配置
- 安装pdf2image
pip install pdf2image
- 安装 Poppler
1、Windows系统:
在https://github.com/oschwartz10612/poppler-windows/releases/tag/v25.07.0-0
页面下载zip文件并解压,然后在系统的path增加路径:C:\poppler-25.07.0\Library\bin(根据自己的解压位置更改)。
2、Ubuntu系统:
sudo apt install -y poppler-utils
使用
from pdf2image import convert_from_pathpages = convert_from_path('path/mypdf.pdf')for i, page in enumerate(pages):page.save(f'page_{i+1}.png', 'PNG')
字体失真解决方法
原pdf文件的字体显示:
转换后的显示:
转换后明显字体失真。
用adobe acrobat pro打开pdf文件,文件--属性--字体:
下载缺失的两种字体并安装即可。
或者,安装pdf panthom,用pdf panthom的虚拟打印机在adobe acrobat pro中将文件打印为图片格式的pdf文件,绕开字体问题。