当前位置：首页 > news >正文

【AI绘图模型介绍】Checkpoint / LoRA / VAE / Embeddings 模型是什么?

news 2025/7/4 17:50:43

前言

笔者最近在做一套自己的网站 , 因为之前公司一直在做Ai相关的项目 , 所以笔者也想在自己的网站上集成相关的功能 , 第一个绕不开的功能就是Ai绘图和大语言模型 , 大语言模型已经集成做好了 , 所以从Ai绘图开始 , 刚开始接触的时候碰到了不少模型相关的概念 , 做个笔记 , 帮助学习理解

下面开始正文介绍

1. 基础模型（Checkpoint）

用途：生成图像的核心模型，决定整体风格（写实、二次元等）。
文件类型：.ckpt, .safetensors
存放路径：models/Stable-diffusion/
示例模型：
- SDXL 1.0：官方通用模型
- ChilloutMix：亚洲写实风格
特点：
- 体积大（2-7GB）
- 切换模型会彻底改变生成风格

2. LoRA（低秩适应模型）

用途：微调基础模型的特定风格/角色。
文件类型：.safetensors
存放路径：models/Lora/
使用方式：<lora:模型名:权重>（如 <lora:koreanDollLikeness_v10:0.8>）
特点：
- 体积小（10-200MB）
- 可叠加多个 LoRA

3. VAE（变分自编码器）

用途：改善图像颜色和细节，解决"画面发灰"。
文件类型：.pt, .ckpt
存放路径：models/VAE/
设置位置：Settings → Stable Diffusion → VAE
常见模型：
- vae-ft-mse-840000-ema-pruned（官方推荐）

4. Embeddings（文本反演模型）

用途：通过关键词触发特定概念/风格。
文件类型：.pt, .bin
存放路径：embeddings/
示例模型：
- easynegative：负面提示增强

5. Hypernetwork（超网络）

用途：调整生成风格（类似 LoRA）。
文件类型：.pt
存放路径：models/hypernetworks/
特点：
- 逐渐被 LoRA 取代

6. ControlNet（控制网络）

用途：通过姿势/线稿控制构图。
文件类型：.pth, .safetensors
存放路径：extensions/sd-webui-controlnet/models/
依赖插件：需安装 ControlNet 插件

7. Textual Inversion（文本反演）

用途：训练自定义概念（如特定物体）。
文件类型：.pt
存放路径：embeddings/

8. Upscaler（超分辨率模型）

用途：图像高清放大。
文件类型：.pth
存放路径：models/ESRGAN/
常用模型：
- 4x-UltraSharp

9. Dreambooth 模型

用途：训练专属模型（如特定人物）。
文件类型：.ckpt, .safetensors
存放路径：models/Stable-diffusion/

10. 其他专用模型

Inpainting 模型：局部重绘
Anime 专用模型：如 Waifu Diffusion

模型搭配技巧

基础模型 + LoRA + ControlNet：精准控制风格与构图
VAE + Upscaler：提升画质与分辨率

结语

吐槽一下 , 现在的大环境来说Ai已经是越来越绕不开的一个技术点了 , 现在出去不说你懂点Ai人家都觉得你是老古董 , 掌握一些Ai能力还是对我们的职业生涯有很大帮助的 , 能多为我们提升一些竞争力 , 长路漫漫 , 诸君共勉

查看全文

http://www.dtcms.com/a/78061.html

Java：Apache HttpClient中HttpRoute用法的介绍

如何让节卡机器人精准对点？

基于基于eFish-SBC-RK3576工控板的智慧城市边缘网关

3.3 二分查找专题： LeetCode 35. 搜索插入位置

事务隔离级别是？

04 泛型编程

AMBA-CHI协议详解（二十四）

window.btoa 和 atob 记不住，怎么根据字母意思去理解

错误: 缺少 JavaFX 运行时组件, 需要使用该组件来运行此应用程序

当底层硬盘老旧时，如何限制Linux服务器和Windows服务的IOPS？

苍穹外卖-Spring Task使用的前置条件

GROOT N1，英伟达开源的人形机器人模型

【LLMs篇】06：Encoder-Only vs Decoder-Only vs Encoder-Decoder

OWASP Top 10 解读：如何构建更安全的应用？

【C++】二叉树和堆的链式结构

阿里云 AI 搜索产品荣获 Elastic Innovation Award 2024

MySQL 调优

线性规划的标准形式

openpnp - 如果安装面的钣金接触面不平，可以尝试加垫片

Springboot List集合的校验方式

替代Qt中信号与槽的完整例子。

CVPR2025 | TAPT：用于视觉语言模型鲁棒推理的测试时对抗提示调整

如何实现一个DNS

Java Web应用程序实现用户登录、学生信息管理和验证码验证以及页面跳转等基本功能（IDEA）含（Ajax、JSTL）

【时时三省】(C语言基础)用gutchar函数输入一个字符

Session 、Cookies 和 Token关系于区别

k8s中的service解析

SAP HTTP接口获取文件应用

医院人事科室病区管理系统基于Spring Boot-SSM

点击劫持详细透析

前言