当前位置：首页 > news >正文

wkhtmltopdf 实现批量对网页转为图片的好工具，快速实现大量卡片制作

news 2025/10/29 22:41:17

欢迎来到涛涛聊AI

1、需求痛点

在学习当中经常遇到一些知识点，想和大家分享。但只有文本形式，很多人不愿意去阅读，也看不到重点。

如果自己去单独设计页面版式，又太浪费时间。那就想着有没有一种方法，可以把一个知识点做成卡片形式的。

当然通过扣子平台可以完成。可是每一个知识点的形式不固定。有大有小，有长有短。

让大模型生成图片又行不通。想到了让大模型生成网页形式，然后再对网页形式截图，形成卡片。

好主意，说干就干。

大模型生成网页这个已经没有难度，而且也进行了实验，完全可行。

优先解决生成图片的问题。

经过网络搜索，知道了这个wkhtmltopdf.但其实也可以生成网页。下面我们就一步一步来演示操作。

2、软件安装。

这个软件不太好找，很多的时候下载不下来。为了方便大家使用，我已经将它放置网盘。需要的同学自行获取。

更换安装路径。

为了避免后期在使用命令行调用的时候，出现莫名的错误。所以这里建议放到一个没有空格的，并且只有英文的目录当中。

3、查看帮助。

查看目录结构。

内容非常少，在bin目录有exe文件。

显示命令选项。

利用大模型进行翻译。

直接把图片丢给豆包大模型。

这是 wkhtmltoimage 工具的命令行选项说明文档。wkhtmltoimage 是一个能将 HTML 页面转换为图片的工具。以下是对这些选项的介绍：

一般选项

裁剪相关

- --crop-h <int>：设置裁剪高度。
- --crop-w <int>：设置裁剪宽度。
- --crop-x <int>：设置裁剪的 x 坐标。
- --crop-y <int>：设置裁剪的 y 坐标。

帮助信息

- -H, --extended-help：显示更详尽的帮助信息，介绍不常见的命令开关。
- -h, --help：显示普通帮助信息。

文件格式

- -f, --format <format>：指定输出图片的格式。

屏幕尺寸相关

- --height <int>：设置屏幕高度（默认根据页面内容计算，默认值为 0 ）。
- --width <int>：设置屏幕宽度，仅作为参考值，使用 --disable -smart-width 可使其严格生效（默认值 1024）。

许可与日志

- --license：输出版本许可信息后退出。
- --log-level <level>：设置日志级别，可选择 none（无日志）、error（错误日志）、warn（警告日志）、info（信息日志，默认值）。
- -q, --quiet：减少输出信息，等同于 --log-level none，用于向后兼容。

图片质量与版本

- --quality <int>：设置输出图片质量，取值范围 0 - 100（默认 94 ）。
- -V, --version：输出版本信息后退出。

如果使用中遇到问题或想请求新功能，可访问 <https://wkhtmltopdf.org/support.html>

4、实战演练。

使用大模型生成的相关使用。

第一次的提示词

我写的提示词如下。

请帮我生成关于 wkhtml2pdf.相关知识的介绍和使用。用html格式输出。我要将网页截成图片。方便在手机上阅读。所以生成的网页宽高比。要对手机访问友好。

让大模型优化提示词。

再次和AI交互

我现在想编写一段大模型提示词，我把需求发给你，你帮我把提示词生成下，

AI上道了。

我的需求

任务类型 ：创意HTML编写

核心需求：更加用户输入的主题，生成相关知识、或者使用的简述

角色设定：AI专家，技术专家

输入数据：一个主题

输出要求：html格式

约束条件：版式面向手机访问

需求参考示例：python学习路线、什么是智能体、AI绘画如何入门

AI给出的模版

### 角色设定 
您是兼具AI专家与技术传播者双重身份的知识架构师，擅长将复杂概念转化为移动端友好的结构化内容。
 
### 核心任务 
基于用户提供的主题，生成符合以下要求的知识内容：
1. 核心概念解释（3个关键点）
2. 学习/实践路径（分3阶段）
3. 常见问题解析（2-3个典型问题）
4. 资源推荐（分工具/教程/社区3类）
 
### 背景约束 
- 用户场景：手机端知识速查 
- 知识深度：兼顾新手理解与进阶指引 
- 风险规避：需标注前沿技术的局限性 
 
### 输入处理 
{{ 用户主题 }} 示例参考：
- Python学习路线：需包含版本选择建议、IDE对比 
- 智能体技术：区分与传统AI的差异 
- AI绘画入门：提示词工程基础+版权声明 
 
### 输出要求 
1. **结构规范**
   - 每模块带🔑emoji引导重点 
   - 段落≤3行，每行≤15字 
   - 技术名词后括号标注英文 
2. **移动端优化**
   - 主标题H2+子标题H3 
   - 关键数据用**加粗**突出 
   - 避免嵌套表格/复杂列表 
3. **内容控制**
   - 总字数300-400字 
   - 每模块包含1个类比案例 
   - 禁用数学公式 
 
### 生成示例（以"深度学习入门"为例）
🔑 **核心三要素** 
- 神经网络（Neural Network）→ 类脑结构模拟 
- 损失函数（Loss Function）→ 效果评估尺 
- 反向传播（Backpropagation）→ 参数调整术 
 
📚 **三阶段路径** 
1. 基础认知：Python→线性代数→PyTorch 
2. 实战进阶：Kaggle Titanic→MNIST手写识别 
3. 领域深化：CV/NLP/RL任选专项突破 
...

做了个工作流，但格式太固定了。而且也不是html，难道是我的想法不能实现？

还是我自己分下类吧但生成的markdown，我要的是html，调整提示词。

第三次提示词

# 角色
你是一位出色的知识架构师，兼具AI专家与技术传播者的双重身份，擅长把复杂概念转化为适合移动端浏览的结构化内容。

## 技能
### 技能 1: 概念类知识内容
1. 基于用户提供的主题，生成主题的知识内容：
    - 核心概念解释（3个关键点）
    - 学习/实践路径（分3阶段）
    - 实例（2个例子）
    - 常见问题解析（2 - 3个典型问题）
    - 资源推荐（分工具/教程/社区3类）
### 技能 1: 实操类技能    
2. 基于用户提供的主题，生成主题的知识内容：
    - 操作步骤
    - 常见问题解析（2 - 3个典型问题）
2. 生成的内容需符合以下规范：
    - 结构规范：
        - 每模块带🔑emoji引导重点 
        - 段落≤3行，每行≤15字 
    - 移动端优化：
        - 主标题H2+子标题H3 
        - 关键数据用加粗突出 
        - 避免嵌套表格/复杂列表
    - 内容控制：
        - 总字数300 - 400字 
        - 每模块包含1个类比案例 
        - 禁用数学公式
      - 输出格式：
        -输出为HTML格式
 

### 示例参考（以"深度学习入门"为例）
🔑 **核心三要素** 
- 神经网络（Neural Network）→ 类脑结构模拟 
- 损失函数（Loss Function）→ 效果评估尺 
- 反向传播（Backpropagation）→ 参数调整术 
 
📚 **三阶段路径** 
1. 基础认知：Python→线性代数→PyTorch 
2. 实战进阶：Kaggle Titanic→MNIST手写识别 
3. 领域深化：CV/NLP/RL任选专项突破 
 
### 输入处理 
{{ 用户主题 }}示例参考：
- Python学习路线：需包含版本选择建议、IDE对比 
- 智能体技术：区分与传统AI的差异 
- AI绘画入门：提示词工程基础+版权声明 

## 限制:
- 用户场景限定为手机端知识速查。
- 知识深度需兼顾新手理解与进阶指引。
- 需标注前沿技术的局限性。
- 生成html格式
- 所输出的内容必须按照给定的格式进行组织，不能偏离框架要求。

还得慢慢优化。

wkhtmltoimage 命令行示例

自由发挥

为了兼容问题的随机性，干脆去掉过多的限定，让大模型自由发挥些。

请根据用户的主题生成相关知识的介绍和使用。
要求
1、用html格式输出，我要将网页截成图片。
2、页面版式方便在手机上阅读
3、添加emoji符合方便阅读
4、样式和内容在一起，不要分成多个文件

测试下

原始网页

结果emoji表情没有了

更换为添加颜色吧

还好吧，慢慢优化。

这样可以批量用程序去生成小卡片

.\wkhtmltoimage.exe --quality 85 D:\ProgramData\wkhtmltopdf\html\mcp2.html aaa2.jpg

查看全文

http://www.dtcms.com/a/130463.html

数学建模学习资料免费分享：历年赛题与优秀论文、算法课程、数学软件等

Java基础自学（1）：一个简单的Java程序

如何使用PyCharm自动化测试

医药采购系统平台第4天03：实现根据用户的角色显示不同用户的权限菜单编写拦截器实现权限拦截模块的开发流程和测试流程小节

FileReader 详细解析与记忆方法

DataEase同比环比

微信小程序实战案例 - 餐馆点餐系统阶段 2 – 购物车

嵌入式常见概念的介绍

C++ 重构muduo网络库

FPGA 37 ，FPGA千兆以太网设计实战：RGMII接口时序实现全解析（ RGMII接口时序设计，RGMII~GMII，GMII~RGMII 接口转换）

微信小程序跳4

RT-2论文深度解读：视觉-语言-动作统一模型的机器人泛化革命

AI NAS：当网络存储与人工智能深度融合的技术路径与未来展望

nvm使用手册

java零基础教学笔记

02核心-EffectSpec,EffectContext

RV1106 OCR 识别算法

代码随想录算法训练营day3（链表）

流与分组的共生关系

vue + uniapp 实现仿百度地图/高德地图/美团/支付宝滑动面板纯css 实现

Matlab个性化绘图第10期—滑珠进度柱状图

富文本编辑器的内容导出html，并保留图片

【第41节】windows的中断与异常及异常处理方式

【第四十周】文献阅读：用于检索-增强大语言模型的查询与重写

精品整理 | 云安全知识证书 (CCSK) v5 备考学习资源汇总

Reinforcement Learning-Autonomous car-useful

【数学建模】（智能优化算法）粒子群优化算法(PSO)详解与Python实现

【STM32】STemWin库，使用template API

vs2022 pcl1.15.0注意点

实现当文本内容过长时，中间显示省略号...,两端正常展示