当前位置: 首页 > news >正文

python-poppler - PDF文档处理Python绑定库

文章目录

    • 一、关于 python-poppler
      • 1、项目概览
    • 二、相关链接资源
    • 三、安装与使用
      • 1、安装方式
      • 2、基础示例
    • 四、开发贡献


一、关于 python-poppler

1、项目概览

python-poppler 是基于poppler-cpp库的Python绑定,提供PDF文档的读取、渲染和修改功能。

主要功能包括:

  • 读取和修改文档元数据
  • 列出和读取嵌入式文档
  • 列出文档使用的字体
  • 在指定页面搜索或提取文本
  • 将页面渲染为原始图像
  • 获取页面间过渡效果信息
  • 读取文档目录结构

二、相关链接资源

  • Github:https://github.com/cbrunet/python-poppler
  • 官方文档:https://cbrunet.github.io/python-poppler/
  • C++库文档:https://poppler.freedesktop.org/api/cpp/namespacepoppler.html
  • 代码规范:https://github.com/psf/black
  • 问题追踪:https://github.com/cbrunet/python-poppler/issues

三、安装与使用

1、安装方式

pip install poppler

2、基础示例

from poppler import load_from_file, PageRendererpdf_document = load_from_file("sample.pdf")
page_1 = pdf_document.create_page(0)
page_1_text = page_1.text()renderer = PageRenderer()
image = renderer.render_page(page_1)
image_data = image.data

四、开发贡献

1、使用GitHub issue跟踪器提交问题或功能请求
2、代码格式化要求:

tox -e lint

3、运行测试:

tox

4、新功能需提供配套单元测试


伊织 xAI 2025-07-02(三)

http://www.dtcms.com/a/414548.html

相关文章:

  • Android开发-Handler消息机制记录
  • 通信专业知识图谱​
  • 网站建设的页面要求一级域名二级域名
  • 基础镜像清理策略在VPS环境存储优化中的维护规范
  • The 2025 ICPC South America - Brazil First Phase
  • 开源 C# 快速开发(六)自定义控件--圆环
  • Calico 网络插件在 K8s 集群的作用
  • 蓝桥杯13届省题
  • 手机网站开发+图库类怎样在手机上建设网站
  • MySQL三层架构:从连接管理到数据存储
  • 嵌入式硬件——IMX6ULL时钟配置
  • 【用androidx.camera拍摄景深合成照片】
  • linux安装google chrome 谷歌浏览器
  • 从零起步学习Redis || 第二章:Cache Aside Pattern(旁路缓存模式)以及优化策略
  • 两性做受技巧视频网站喊别人做的网站不肯给代码
  • ESP32-S3入门第八天:往期知识回顾与实战练习
  • Claude Code 实战指南(三):AI辅助开发工作流 Spec Workflow MCP教程
  • 红帽认证含金量怎么样?适合哪些人?
  • 宣传的网站开发需要多少钱步骤的英文
  • 选择一款拖拽式界面的vscode扩展程序制作Python界面
  • Android开发-屏幕变更事件
  • 十大咨询公司排行榜aso优化师主要是干嘛的
  • LeetCode第1346题 - 检查整数及其两倍数是否存在
  • 【Leetcode hot 100】207.课程表
  • 搜索引擎高级搜索技巧
  • 2.3 物理层设备 (答案见原书 P48)
  • 华为OBS obsutil使用
  • 租购同权七年之痒:政策善意如何变现?
  • 【Linux操作系统】基础开发工具
  • 老年ai模拟恋爱抖音快手微信小程序看广告流量主开源