当前位置: 首页 > news >正文

开始 ComfyUI 的 AI 绘图之旅-SD3.5文生图和图生图(全网首发,官网都没有更新)(十五)

文章标题

  • 系列文章
  • 一、什么是Stable Diffusion?
    • 1.Stable Diffusion 模型版本
    • 2.SD3.5模型下载
  • 二、SD3.5工作流介绍
    • 1.SD3.5简单版本
    • 2.SD3.5 ControlNet canny
    • 3.SD3.5 ControlNet blur
    • 4.SD3.5 ControlNet depth

系列文章

  • 基础篇
    • 开始 ComfyUI 的 AI 绘图之旅-Stable Diffusion文生图(一)
    • 开始 ComfyUI 的 AI 绘图之旅-Stable Diffusion图生图(二)
    • 开始 ComfyUI 的 AI 绘图之旅-Stable Diffusion图生图之局部重绘(Inpaint)和扩图(Outpaint)(三)
    • 开始 ComfyUI 的 AI 绘图之旅-RealESRGAN图生图之图像放大(四)
    • 开始 ComfyUI 的 AI 绘图之旅-LoRA(五)
    • 开始 ComfyUI 的 AI 绘图之旅-ControlNet(六)
  • Flux.1
    • 开始 ComfyUI 的 AI 绘图之旅-Flux.1文生图(全网首发,官网都没有更新)(七)
    • 开始 ComfyUI 的 AI 绘图之旅-Flux.1图生图(八)
    • 开始 ComfyUI 的 AI 绘图之旅-Flux.1图生图之局部重绘(Inpaint)和扩图(Outpaint)(九)
    • 开始 ComfyUI 的 AI 绘图之旅-Flux.1 ControlNet & Lora(十)
  • 进阶篇
    • 开始 ComfyUI 的 AI 绘图之旅-Qwen-Image(十一)
    • 开始 ComfyUI 的 AI 绘图之旅-Qwen-Image-Edit(十二)
    • 开始 ComfyUI 的 AI 绘图之旅-Cosmos Predict2世界模型文生图(全网首发,官网都没有更新)(十三)
    • 开始 ComfyUI 的 AI 绘图之旅-SDXL文生图和图生图(全网首发,官网都没有更新)(十四)

一、什么是Stable Diffusion?

Stable Diffusion是2022年发布的深度学习文本到图像生成模型。它主要用于根据文本的描述产生详细图像,尽管它也可以应用于其他任务,如内补绘制、外补绘制,以及在提示词指导下产生图生图的转变。

它是一种潜在扩散模型,由慕尼黑大学的CompVis研究团体开发的各种生成性人工神经网络之一。[3]它是由初创公司StabilityAI、CompVis与Runway合作开发,并得到EleutherAI和LAION的支持。截至2022年10月,StabilityAI筹集了1.01亿美元的资金。

Stable Diffusion的源代码和模型权重已分别公开发布在GitHub和Hugging Face,可以在大多数配备有适度GPU的电脑硬件上运行。而以前的专有文生图模型(如DALL-E和Midjourney)只能通过云计算服务访问。

1.Stable Diffusion 模型版本

来源:https://zh.wikipedia.org/zh-cn/Stable_Diffusion

版本号发行日期参数注释
1.1, 1.2, 1.3, 1.42022年8月都由CompVis发行。没有版本1.0。1.1引发1.2,而1.2引发1.3和1.4二者[33]。
1.52022年10月983M以1.2而非1.4的权重初始化。由RunwayML发行。
2.02022年11月从头在过滤后的数据集上重新训练[36]。
2.12022年12月以2.0的权重初始化。
XL 1.02023年7月3.5BXL 1.0基础模型有35亿个参数,使其比以前版本大了约3.5倍。[39]
XL Turbo2023年11月提取自XL 1.0而以更少扩散步骤运行。[41]
3.02024年2月(早期预览)800M到8B模型家族。
3.52024年10月2.5B到8B具有Large(80亿个参数)、Large Turbo(提取自SD 3.5)和Medium (25亿个参数)的模型家族。

2.SD3.5模型下载

安装aria2快速下载模型,几乎能将我家1000M的宽带跑满,每秒80~90M,接下来的介绍模型都会给出安装命令。

apt install aria2
aria2c https://huggingface.co/Comfy-Org/stable-diffusion-3.5-fp8/resolve/main/sd3.5_large_fp8_scaled.safetensors?download=true -o SourceCode/ComfyUI/models/checkpoints/sd3.5_large_fp8_scaled.safetensors --auto-file-renaming=false --allow-overwrite=falsearia2c https://huggingface.co/stabilityai/stable-diffusion-3.5-controlnets/resolve/main/sd3.5_large_controlnet_blur.safetensors?download=true -o SourceCode/ComfyUI/models/controlnet/sd3.5_large_controlnet_blur.safetensors --auto-file-renaming=false --allow-overwrite=false  --load-cookies /home/d/Downloads/huggingface.co_cookies.txtaria2c https://huggingface.co/stabilityai/stable-diffusion-3.5-controlnets/resolve/main/sd3.5_large_controlnet_depth.safetensors?download=true -o SourceCode/ComfyUI/models/controlnet/sd3.5_large_controlnet_depth.safetensors --auto-file-renaming=false --allow-overwrite=false  --load-cookies /home/d/Downloads/huggingface.co_cookies.txtaria2c https://huggingface.co/stabilityai/stable-diffusion-3.5-controlnets/resolve/main/sd3.5_large_controlnet_canny.safetensors?download=true -o SourceCode/ComfyUI/models/controlnet/sd3.5_large_controlnet_canny.safetensors --auto-file-renaming=false --allow-overwrite=false  --load-cookies /home/d/Downloads/huggingface.co_cookies.txt

小技巧:你要是打不开https://huggingface.co,可以将其换成为https://hf-mirror.com/试一试

二、SD3.5工作流介绍

https://comfyanonymous.github.io/ComfyUI_examples/sd3/
在这里插入图片描述

1.SD3.5简单版本

如果您还没有从 SD3、Flux 或其他模型下载文本编码器文件(例如clip_l.safetensors、clip_g.safetensors和 t5xxl) ,请先下载它们(如果您的 ComfyUI/models/text_encoders/ 文件夹中还没有)。对于 t5xxl,如果您的内存超过 32GB,我建议您下载t5xxl_fp16.safetensors ;如果您的内存不足,我建议您下载t5xxl_fp8_e4m3fn_scaled.safetensors 。

SD3.5 模型系列包含一个大型 8B 模型和一个中型 2.5B 模型。中型模型速度更快,占用内存更少,但对某些概念的理解可能不那么复杂。我建议下载这两个模型,并尝试一下它们如何响应你的提示。

sd3.5_large.safetensors和sd3.5_medium.safetensors文件(选择您想要的文件并将其放在 ComfyUI/models/checkpoints/ 目录中)不包含文本编码器/CLIP 权重,因此您必须单独加载它们才能使用该文件,就像以下示例一样:
在这里插入图片描述
要使用sd3.5_large_turbo.safetensors文件(将其放在 ComfyUI/models/checkpoints/ 目录中),您可以使用上面的示例并将步骤设置为 4 并将 cfg 设置为 1.2。

为了方便起见,我们提供了一个易于使用的一体化检查点文件sd3.5_large_fp8_scaled.safetensors(将其放在 ComfyUI/models/checkpoints/ 目录中),该文件可以像其他检查点文件一样在默认工作流程中使用。此外,还有一个适用于 SD3.5 Medium 的检查点文件:sd3.5_medium_incl_clips_t5xxlfp8scaled.safetensors 。

请参阅此工作流程作为示例。

运行结果:
在这里插入图片描述

2.SD3.5 ControlNet canny

Stability 发布了一些官方的 SD3.5 ControlNet,您可以在这里找到这些文件(sd3.5_large_controlnet_canny.safetensors、sd3.5_large_controlnet_depth.safetensors、sd3.5_large_controlnet_blur.safetensors)位于您的 ComfyUI/models/controlnet 目录中,旨在与 SD3.5 large 一起使用。

请参阅此工作流程以获取使用 canny(sd3.5_large_controlnet_canny.safetensors)ControlNet的示例:
在这里插入图片描述

3.SD3.5 ControlNet blur

在这里插入图片描述

4.SD3.5 ControlNet depth

在这里插入图片描述

http://www.dtcms.com/a/392763.html

相关文章:

  • [数理逻辑] 决定性公理与勒贝格可测性 (III) 有限维情况
  • 浅谈 “混合检索”和“重排”
  • 计算机视觉与深度学习 | 基于Matlab的雾霾天气和夜间车牌识别系统关键技术与架构设计
  • 二、PyTorch张量学习教程:从小白到高手的实战之旅
  • 名字空间,异常与匿名函数
  • DCM项目wan 1.3b T2V模型comfyui改造流程尝试
  • python编写的第一个appium自动化测试脚本
  • 道客巴巴文库资料免费下载的方法(不需要第三方软件)
  • 【C++】STL详解(九)—priority_queue的使用与模拟实现
  • 【车载开发系列】了解FlashDriver
  • 轻量化 AI 算法:开启边缘智能新时代
  • sward入门到实战(3) - 如何管理文档
  • 贝叶斯优化(Bayesian Optimization)实战:超参数自动搜索的黑科技
  • CSP-S2025 第一轮试题(附答案)
  • python ipynb中运行 报错rpy2 UsageError: Cell magic `%%R` not found.,原因是命令行要用raw的格式
  • 蓝耘智算与DeepSeekR1:低成本高能AI模型
  • Shimmy,超越ollama?
  • LeetCode:36.二叉树的中序遍历
  • python开发环境VSCode中隐藏“__pycache__”目录实践
  • Chrome View渲染机制学习小记
  • C# Protobuf oneof、包装器类型、枚举命名与服务支持
  • 智慧消防:科技赋能,重塑消防安全新生态
  • AI人工智能训练师五级(初级)实操模拟题
  • [数理逻辑] 决定性公理与勒贝格可测性(I) 基础知识
  • Java面向对象之多态
  • 量子计算学习续(第十五周周报)
  • Docker 入门与实践:从零开始掌握容器化技术
  • 个人用户无公网 IP 访问群晖 NAS:神卓 N600 的安全便捷方案(附踩坑经验)
  • Cpolar内网穿透实战:从零搭建远程访问服务
  • 【Python精讲 03】Python核心容器:一篇通关序列(List, Tuple)、映射(Dict)与集合(Set)