当前位置: 首页 > news >正文

【python】网页批量转PDF

安装wkhtmltopdf 

网站:wkhtmltopdf

wkhtmltopdf http://www.baidu.com/ D:website1.pdf

安装pdfkit库

pip install pdfkit

批量转换代码

import os
import pdfkit
path_wkthmltopdf = r'E:\Program Files\wkhtmltopdf\bin\wkhtmltopdf.exe'
config = pdfkit.configuration(wkhtmltopdf=path_wkthmltopdf)

def convert_html_to_pdf(input_folder, output_folder):
    # 确保输出文件夹存在
    if not os.path.exists(output_folder):
        os.makedirs(output_folder)

    # 遍历输入文件夹及其子文件夹中的所有文件
    for root, dirs, files in os.walk(input_folder):
        for file in files:
            if file.endswith(".htm"):
                html_file_path = os.path.join(root, file)
                pdf_file_path = os.path.join(output_folder, file.replace('.htm', '.pdf'))

                try:
                    # 使用pdfkit将HTML文件转换为PDF文件
                    pdfkit.from_file(html_file_path, pdf_file_path,configuration=config, options={'encoding': 'utf-8',"enable-local-file-access":True})
                    print(f"成功转换: {html_file_path} -> {pdf_file_path}")
                except Exception as e:
                    print(f"转换失败: {html_file_path} -> {pdf_file_path}, 错误信息: {e}")


if __name__ == "__main__":
    input_folder = 'D:\'  # 输入文件夹路径,这里设置为当前目录
    output_folder = 'D:\pdf'  # 输出文件夹路径
    convert_html_to_pdf(input_folder, output_folder)

报错解决

Python OSError: wkhtmltopdf reported an error:Exit with code 1 due to network error:ProtocolUnknownE_exit with code 1 due to network error: protocolunk-CSDN博客

参考

pdfkit | 利用python实现html文件转pdf (zhihu.com)

Python OSError: wkhtmltopdf reported an error:Exit with code 1 due to network error:ProtocolUnknownE_exit with code 1 due to network error: protocolunk-CSDN博客

相关文章:

  • 【Python爬虫(30)】构建高效爬虫数据管理体系:从抓取到协作
  • 【Linux】序列化、守护进程、应用层协议HTTP、Cookie和Session
  • 头条搜索下拉词和抖音搜索提示词删除的方法
  • 通过 WSL 2(Windows Subsystem for Linux 2)运行基于 Linux 的容器,怎么在浏览器中打开镜像默认页
  • 如何调用 DeepSeek API:详细教程与示例
  • 环境变量3
  • Android开发-深入解析Android中的AIDL及其应用场景
  • 【深度学习】Unet的基础介绍
  • 【Redis】在Java中以及Spring环境下操作Redis
  • 超高清大图渲染性能优化实战:从页面卡死到流畅加载
  • 前端vue的一些常见项目启动命令
  • EasyRTC低延迟通信与智能处理:论嵌入式WebRTC与AI大模型的技术融合
  • Mybatis(一)
  • MySQL修改JSON格式数据示例
  • 中文Build a Large Language Model (From Scratch) 免费获取全文
  • C++之虚函数、虚函数表
  • C 数据类型转换那些事
  • 力扣hot100 ——搜索二维矩阵 || m+n复杂度优化解法
  • 前端js题目大全
  • 计算机视觉算法实战——表面缺陷检测(主页有源码)
  • 建设局网站管理办法/谁有推荐的网址
  • 深圳个人做网站/哈尔滨怎样关键词优化
  • 建网电气有限公司/宁波最好的seo外包
  • 答题网站怎么做/seo如何优化关键词
  • 简述企业网站的建设过程/做网站需要什么技术
  • 北京响应式网站/百度收录提交网址