如何使用 Python 转换 Excel 工作表到 PDF 文档
在日常办公和数据处理中,我们经常需要将 Excel 文档转换为 PDF 格式。PDF 格式具有跨平台兼容性好、格式固定不易篡改、便于分享和打印等优势,因此成为文档分发的理想选择。今天我们将介绍如何使用 Spire.XLS for Python 库来实现 Excel 到 PDF 的高效转换,涵盖从基础转换到高级设置的全流程。
环境准备与安装
在开始之前,我们需要先用 pip 工具进行安装:
pip install Spire.XLS
免费版 (有限制):
pip install Spire.XLS.Free
基础 Excel 转 PDF 实现
让我们从最基本的转换开始,将整个 Excel 工作簿转换为 PDF 文件:
from spire.xls import *
from spire.xls.common import *# 加载 Excel
workbook = Workbook()
workbook.LoadFromFile("sample.xlsx")# 设置工作表自适应页面
workbook.ConverterSetting.SheetFitToPage = True# 转换为 PDF
workbook.SaveToFile("ToPdf.pdf", FileFormat.PDF)
workbook.Dispose()
这段代码实现了最基本的转换功能,主要包含三个步骤:
- 创建 Workbook 对象
- 加载 Excel 文件
- 保存为 PDF 格式
转换指定工作表
有时我们不需要转换整个工作簿,只需要转换其中的一个或多个工作表。Spire.XLS 提供了灵活的选项来实现这一点:
from spire.xls import *
from spire.xls.common import *# 加载 Excel
workbook = Workbook()
workbook.LoadFromFile("C:\\Users\\Administrator\\Desktop\\input.xlsx")# 获取指定工作表
sheet = workbook.Worksheets[1]# 设置工作表自适应页面
workbook.ConverterSetting.SheetFitToPage = True# 转换为 PDF
sheet.SaveToPdf("WorksheetToPdf.pdf")
workbook.Dispose()
高级 PDF 转换设置
Spire.XLS 提供了丰富的转换选项,让我们可以自定义 PDF 的输出效果。以下是一些常用的高级设置:
设置 PDF 导出参数
- 页面方向(纵向/横向)
- 纸张大小(A4/A3)
- 页边距
- 是否显示网格线
# 获取 PageSetup 对象
pageSetup = sheet.PageSetup# 设置页面方向
pageSetup.Orientation = PageOrientationType.Landscape;# 设置页面大小
pageSetup.PaperSize = PaperSizeType.PaperA4;# 设置页边距
pageSetup.TopMargin = 0.3
pageSetup.BottomMargin = 0.3
pageSetup.LeftMargin = 0.3
pageSetup.RightMargin = 0.3# 显示网格线
pageSetup.IsPrintGridlines = true;
批量转换多个 Excel 文件
当需要处理多个 Excel 文件时,我们可以编写批量转换脚本:
import os
from spire.xls import *
from spire.xls.common import *def batch_excel_to_pdf(input_dir, output_dir):"""批量转换指定目录下的所有 Excel 文件为 PDF参数:input_dir: 包含 Excel 文件的目录output_dir: 输出 PDF 文件的目录"""# 确保输出目录存在if not os.path.exists(output_dir):os.makedirs(output_dir)# 获取目录下所有 Excel 文件excel_extensions = ('.xls', '.xlsx', '.xlsm', '.xlsb')excel_files = [f for f in os.listdir(input_dir) if f.lower().endswith(excel_extensions)]if not excel_files:print(f"在 {input_dir} 中未找到 Excel 文件")returnworkbook = Workbook()try:for i, filename in enumerate(excel_files, 1):excel_path = os.path.join(input_dir, filename)# 生成输出 PDF 文件名pdf_filename = os.path.splitext(filename)[0] + '.pdf'pdf_path = os.path.join(output_dir, pdf_filename)print(f"正在转换 {i}/{len(excel_files)}: {filename}")# 加载并转换workbook.LoadFromFile(excel_path)workbook.SaveToFile(pdf_path, FileFormat.PDF)# 清空工作簿,准备下一个文件workbook.Dispose()workbook = Workbook()print(f"已保存: {pdf_filename}")print(f"批量转换完成,共处理 {len(excel_files)} 个文件")except Exception as e:print(f"转换过程中出错: {str(e)}")finally:workbook.Dispose()# 使用示例
if __name__ == "__main__":input_directory = "需要转换的Excel文件" # 存放Excel文件的目录output_directory = "转换后的PDF文件" # 输出PDF的目录batch_excel_to_pdf(input_directory, output_directory)
总结
Spire.XLS for Python 为 Excel 转 PDF 提供了强大而灵活的解决方案,无论是简单的单文件转换还是复杂的批量处理,都能轻松应对。通过本文介绍的方法,你可以根据实际需求定制转换过程,获得高质量的 PDF 输出。
希望本文能帮助你高效地实现 Excel 到 PDF 的转换需求,提升工作效率!
