当前位置: 首页 > news >正文

【AI绘图模型介绍】Checkpoint / LoRA / VAE / Embeddings 模型是什么?

前言

笔者最近在做一套自己的网站 , 因为之前公司一直在做Ai相关的项目 , 所以笔者也想在自己的网站上集成相关的功能 , 第一个绕不开的功能就是Ai绘图和大语言模型 , 大语言模型已经集成做好了 , 所以从Ai绘图开始 , 刚开始接触的时候碰到了不少模型相关的概念 , 做个笔记 , 帮助学习理解

下面开始正文介绍


1. 基础模型(Checkpoint)

  • 用途:生成图像的核心模型,决定整体风格(写实、二次元等)。
  • 文件类型.ckpt, .safetensors
  • 存放路径models/Stable-diffusion/
  • 示例模型
    • SDXL 1.0:官方通用模型
    • ChilloutMix:亚洲写实风格
  • 特点
    • 体积大(2-7GB)
    • 切换模型会彻底改变生成风格

2. LoRA(低秩适应模型)

  • 用途:微调基础模型的特定风格/角色。
  • 文件类型.safetensors
  • 存放路径models/Lora/
  • 使用方式<lora:模型名:权重>(如 <lora:koreanDollLikeness_v10:0.8>
  • 特点
    • 体积小(10-200MB)
    • 可叠加多个 LoRA

3. VAE(变分自编码器)

  • 用途:改善图像颜色和细节,解决"画面发灰"。
  • 文件类型.pt, .ckpt
  • 存放路径models/VAE/
  • 设置位置Settings → Stable Diffusion → VAE
  • 常见模型
    • vae-ft-mse-840000-ema-pruned(官方推荐)

4. Embeddings(文本反演模型)

  • 用途:通过关键词触发特定概念/风格。
  • 文件类型.pt, .bin
  • 存放路径embeddings/
  • 示例模型
    • easynegative:负面提示增强

5. Hypernetwork(超网络)

  • 用途:调整生成风格(类似 LoRA)。
  • 文件类型.pt
  • 存放路径models/hypernetworks/
  • 特点
    • 逐渐被 LoRA 取代

6. ControlNet(控制网络)

  • 用途:通过姿势/线稿控制构图。
  • 文件类型.pth, .safetensors
  • 存放路径extensions/sd-webui-controlnet/models/
  • 依赖插件:需安装 ControlNet 插件

7. Textual Inversion(文本反演)

  • 用途:训练自定义概念(如特定物体)。
  • 文件类型.pt
  • 存放路径embeddings/

8. Upscaler(超分辨率模型)

  • 用途:图像高清放大。
  • 文件类型.pth
  • 存放路径models/ESRGAN/
  • 常用模型
    • 4x-UltraSharp

9. Dreambooth 模型

  • 用途:训练专属模型(如特定人物)。
  • 文件类型.ckpt, .safetensors
  • 存放路径models/Stable-diffusion/

10. 其他专用模型

  • Inpainting 模型:局部重绘
  • Anime 专用模型:如 Waifu Diffusion

模型搭配技巧

  1. 基础模型 + LoRA + ControlNet:精准控制风格与构图
  2. VAE + Upscaler:提升画质与分辨率

结语

吐槽一下 , 现在的大环境来说Ai已经是越来越绕不开的一个技术点了 , 现在出去不说你懂点Ai人家都觉得你是老古董 , 掌握一些Ai能力还是对我们的职业生涯有很大帮助的 , 能多为我们提升一些竞争力 , 长路漫漫 , 诸君共勉

相关文章:

  • Java:Apache HttpClient中HttpRoute用法的介绍
  • 如何让节卡机器人精准对点?
  • 基于基于eFish-SBC-RK3576工控板的智慧城市边缘网关
  • 3.3 二分查找专题: LeetCode 35. 搜索插入位置
  • 事务隔离级别是?
  • 04 泛型编程
  • AMBA-CHI协议详解(二十四)
  • window.btoa 和 atob 记不住,怎么根据字母意思去理解
  • 错误: 缺少 JavaFX 运行时组件, 需要使用该组件来运行此应用程序
  • 当底层硬盘老旧时,如何限制Linux服务器和Windows服务的IOPS?
  • 苍穹外卖-Spring Task使用的前置条件
  • GROOT N1,英伟达开源的人形机器人模型
  • 【LLMs篇】06:Encoder-Only vs Decoder-Only vs Encoder-Decoder
  • OWASP Top 10 解读:如何构建更安全的应用?
  • 【C++】二叉树和堆的链式结构
  • 阿里云 AI 搜索产品荣获 Elastic Innovation Award 2024
  • MySQL 调优
  • 线性规划的标准形式
  • openpnp - 如果安装面的钣金接触面不平,可以尝试加垫片
  • Springboot List集合的校验方式
  • 特朗普称将禁止伊朗石油买家与美国做生意
  • 《一鸣惊人》五一特别节目:以戏曲为桥梁,展现劳动者的坚守
  • 家政阿姨如何炼成全国劳模?做饭、收纳、养老、外语样样都会
  • 强制性国家标准《危险化学品企业安全生产标准化通用规范》发布
  • 五一去哪儿|外国朋友来中国,“买买买”成为跨境旅游新趋势
  • 金砖国家外长会晤落幕,外交部:发出了反对单边霸凌行径的“金砖声音”