当前位置: 首页 > news >正文

python实现pdfs合并

灵感来源于博主正在学408,在搞到视频课对应的ppt.pdf后发现pdf是按小节的,以至于每章有5-10甚至更多,这可太繁琐了,我想要一章一个pdf就可以了,于是浅浅查了几个CSDN发现使用python的要么收费要么要vip,不用py的就是用在线的网站集成的功能,你知道的要充值才能用。算了还是自己搞吧。

由于博主的目标资源是ppt结成图片形成的pdf,也就是要合并的那些pdf文件的内容啊都是图片形式的,不包含字符,大家区分借鉴。

代码如下:

from PyPDF2 import PdfMerger
import osdef merge_pdfs_with_pypdf2(input_folder, output_file):merger = PdfMerger()# 获取文件夹中所有PDF文件pdf_files = [f for f in os.listdir(input_folder) if f.endswith('.pdf')]pdf_files.sort()  # 按文件名排序for pdf in pdf_files:file_path = os.path.join(input_folder, pdf)merger.append(file_path)# 输出合并后的PDFmerger.write(output_file)merger.close()print(f"PDFs合并完成,输出文件: {output_file}")# 使用示例
merge_pdfs_with_pypdf2(r'存放pdfs的文件夹路径', "最终输出合并后结果的pdf文件路径/merged.pdf")

注意默认按照文件名的排序进行合并,如有其它想法的可以提前手动编号。

http://www.dtcms.com/a/336997.html

相关文章:

  • Leetcode 深度优先搜索 (3)
  • WPF中BindingList<T>和List<T>
  • vue3 + antd实现简单的图片点开可以缩小放大查看
  • 浅谈 Python 正则表达式中的 groups()
  • Linux文件相关命令
  • Disbursement on Quarantine Policy(概率、逆元计算期望)
  • 寻北仪如何靠“小”征服地下世界?
  • AI需要防火墙,云计算需要重新构想
  • 20. 云计算-多租户
  • 猫头虎AI分享|一款智能量化交易系统:QuantCell,从数据收集到策略执行全流程自动化
  • C++ 多进程编程深度解析【C++进阶每日一学】
  • 人工智能技术爆发的时代,AI工具和大模型对行业的深刻变革及实际应用!
  • 面向R语言用户的Highcharts
  • DR200差速移动机器人的多功能感知系统与多场景应用
  • 【网络安全实验报告】实验二: 后门木马配置及分析
  • 【网络安全实验报告】实验三:古典加密算法的实现
  • 数字化转型:概念性名词浅谈(第四十一讲)
  • 如何在VS Code中使用Copilot与MCP服务器增强开发体验
  • ThinkPHP的安装运行和调试
  • 动态规划----3.打家劫舍
  • EasyExcel篇
  • C语言篇:猜数字游戏的实现教程
  • 20250818 割点 割边 点双总结
  • 一个基于纯前端技术实现的五子棋游戏,无需后端服务,直接在浏览器中运行。
  • 数据挖掘 3.5 支持向量机——边界和正则化
  • 二分查找例题
  • 从基础到架构的六层知识体系
  • 进阶向:人物关系三元组,解锁人物关系网络的钥匙
  • 如何新建一个自己的虚拟环境
  • 有向无环图(Directed Acyclic Graph, DAG)介绍(环检测、DFS法、Kahn算法、)