当前位置: 首页 > news >正文

使用python 将多个docx文件合并为一个word

先安装python环境 

接着安装依赖 ,采用docxcompose 依赖包 进行合并word,执行如下命令进行安装

pip install docxcompose
from docxcompose.composer import Composer
from docx import Document
import osdef merge_with_docxcompose(doc_list, output_path):master = Document(doc_list[0])composer = Composer(master)for doc_path in doc_list[1:]:doc = Document(doc_path)composer.append(doc)composer.save(output_path)# 定义包含所有需要合并的Word文档路径的列表
documents_to_merge = []
document_dir = './file3'
# 检查目录是否存在
if not os.path.exists(document_dir):raise FileNotFoundError(f"目录 {document_dir} 不存在")# 获取所有.docx文件
for file in sorted(os.listdir(document_dir)):if file.endswith('.docx'):full_path = os.path.join(document_dir, file)documents_to_merge.append(full_path)if not documents_to_merge:raise ValueError("没有找到任何.docx文件进行合并")output_file = 'merged_document5.docx'
# merge_documents(documents_to_merge, output_file)
merge_with_docxcompose(documents_to_merge, output_file)
print(f"文档已成功合并到 {output_file}")

代码说明:  document_dir 是 要合并的文件目录  ;output_file 是合成后的文件  。

依赖包对比: 使用 python-docx 进行合并时, 图片无法合并到新文档中, 使用docxcompose 图片可合并到新文档中。

如果还无法解决实际需求 可考虑

  1. 先将每个文档转为 PDF(使用 python-docx2pdf

  2. 合并 PDF(使用 PyPDF2

  3. 再将合并后的 PDF 转回 Word(如果需要)

http://www.dtcms.com/a/270542.html

相关文章:

  • 【Unity】MiniGame编辑器小游戏(十)连连看【Link】
  • 实时地震分析:AI+Python如何帮我们提前感知大地的怒吼?
  • 使用 Docker 搭建 Go Web 应用开发环境——AI教你学Docker
  • NO.1数据结构绪论|数据结构|逻辑结构|物理结构|算法|算法的度量
  • 从救火到赋能:运维的职责演进与云原生时代的未来图景
  • 聚铭安全管家平台2.0实战解码 | 安服篇(二):无人值守自动化封禁
  • 【Unity】MiniGame编辑器小游戏(十一)消消乐【Crush】
  • 本地Qwen中医问诊小程序系统开发
  • 【目标检测之Ultralytics预测框颜色修改】
  • OpenCV哈希算法------Marr-Hildreth 边缘检测哈希算法
  • 基于DeepSeek构建的openGauss AI智能优化助手:数据库性能提升新利器
  • 微软 Bluetooth LE Explorer 实用工具的详细使用分析
  • 【DOCKER】-3 数据持久化
  • OpenCV图像增强秘籍:高通滤波与特效艺术
  • Web 前端框架选型:React、Vue 和 Angular 的对比与实践
  • PiscTrace深蹲计数功能实现:基于 YOLO-Pose 和人体关键点分析
  • 【python处理excel】B列单元格中的内容都是回车换行的,把这些信息拆成多行多列,并且把A列对应的信息带过去。
  • A模块 系统与网络安全 第四门课 弹性交换网络-2
  • C#正则表达式全面详解:从基础到高级应用
  • 跨部门协作难以对齐项目进度,如何促进协同
  • Rust #[] 语法
  • PHP语法高级篇(一):日期时间处理和包含文件
  • 【系统与工具】Linux——Linux简介、安装、简单使用
  • 详解Kafka重平衡机制详解
  • MySQL8.0基于GTID的组复制分布式集群的环境部署
  • mysql互为主从失效,重新同步
  • 超越公有云:在裸金属服务器上构建低成本、高性能的静态资源服务
  • 创客匠人:创始人 IP 打造中 “放下身段” 的深层逻辑
  • 身份证识别api-便捷生活与安全社会的双重保障
  • 神经网络简介