【AI绘图模型介绍】Checkpoint / LoRA / VAE / Embeddings 模型是什么?
前言
笔者最近在做一套自己的网站 , 因为之前公司一直在做Ai相关的项目 , 所以笔者也想在自己的网站上集成相关的功能 , 第一个绕不开的功能就是Ai绘图和大语言模型 , 大语言模型已经集成做好了 , 所以从Ai绘图开始 , 刚开始接触的时候碰到了不少模型相关的概念 , 做个笔记 , 帮助学习理解
下面开始正文介绍
1. 基础模型(Checkpoint)
- 用途:生成图像的核心模型,决定整体风格(写实、二次元等)。
- 文件类型:
.ckpt
,.safetensors
- 存放路径:
models/Stable-diffusion/
- 示例模型:
SDXL 1.0
:官方通用模型ChilloutMix
:亚洲写实风格
- 特点:
- 体积大(2-7GB)
- 切换模型会彻底改变生成风格
2. LoRA(低秩适应模型)
- 用途:微调基础模型的特定风格/角色。
- 文件类型:
.safetensors
- 存放路径:
models/Lora/
- 使用方式:
<lora:模型名:权重>
(如<lora:koreanDollLikeness_v10:0.8>
) - 特点:
- 体积小(10-200MB)
- 可叠加多个 LoRA
3. VAE(变分自编码器)
- 用途:改善图像颜色和细节,解决"画面发灰"。
- 文件类型:
.pt
,.ckpt
- 存放路径:
models/VAE/
- 设置位置:
Settings → Stable Diffusion → VAE
- 常见模型:
vae-ft-mse-840000-ema-pruned
(官方推荐)
4. Embeddings(文本反演模型)
- 用途:通过关键词触发特定概念/风格。
- 文件类型:
.pt
,.bin
- 存放路径:
embeddings/
- 示例模型:
easynegative
:负面提示增强
5. Hypernetwork(超网络)
- 用途:调整生成风格(类似 LoRA)。
- 文件类型:
.pt
- 存放路径:
models/hypernetworks/
- 特点:
- 逐渐被 LoRA 取代
6. ControlNet(控制网络)
- 用途:通过姿势/线稿控制构图。
- 文件类型:
.pth
,.safetensors
- 存放路径:
extensions/sd-webui-controlnet/models/
- 依赖插件:需安装 ControlNet 插件
7. Textual Inversion(文本反演)
- 用途:训练自定义概念(如特定物体)。
- 文件类型:
.pt
- 存放路径:
embeddings/
8. Upscaler(超分辨率模型)
- 用途:图像高清放大。
- 文件类型:
.pth
- 存放路径:
models/ESRGAN/
- 常用模型:
4x-UltraSharp
9. Dreambooth 模型
- 用途:训练专属模型(如特定人物)。
- 文件类型:
.ckpt
,.safetensors
- 存放路径:
models/Stable-diffusion/
10. 其他专用模型
- Inpainting 模型:局部重绘
- Anime 专用模型:如
Waifu Diffusion
模型搭配技巧
- 基础模型 + LoRA + ControlNet:精准控制风格与构图
- VAE + Upscaler:提升画质与分辨率
结语
吐槽一下 , 现在的大环境来说Ai已经是越来越绕不开的一个技术点了 , 现在出去不说你懂点Ai人家都觉得你是老古董 , 掌握一些Ai能力还是对我们的职业生涯有很大帮助的 , 能多为我们提升一些竞争力 , 长路漫漫 , 诸君共勉