当前位置: 首页 > news >正文

开始 ComfyUI 的 AI 绘图之旅-Flux.1 ControlNet (十)

文章标题

  • 一、ComfyUI Flux.1 ControlNet 示例
    • 1.FLUX.1 ControlNet 模型介绍
    • 2.FLUX.1-Canny-dev 完整版工作流
      • 2.1 工作流及相关素材
      • 2.2 手动模型下载
      • 2.3 按步骤完成工作流的运行
      • 2.4 开始你的尝试
    • 3.FLUX.1-Depth-dev-lora 工作流
      • 3.1 工作流及相关素材
      • 3.2 手动模型下载
      • 3.3 按步骤完成工作流的运行
      • 3.4 开始你的尝试
    • 4.社区版本 Flux Controlnets

一、ComfyUI Flux.1 ControlNet 示例

本文将使用 Flux.1 ControlNet 来完成 ControlNet 的工作流示例。

在这里插入图片描述

1.FLUX.1 ControlNet 模型介绍

FLUX.1 Canny 和 Depth 是由 Black Forest Labs 推出的 ​FLUX.1 Tools 套件 中的两个强大模型。这套工具旨在为 FLUX.1 添加控制和引导能力,使用户能够修改和重新创建真实或生成的图像。

FLUX.1-Depth-devFLUX.1-Canny-dev 都是 12B 参数的 Rectified Flow Transformer 模型,能够基于文本描述生成图像,同时保持与输入图像的一致性。其中 Depth 版本通过深度图提取技术来维持源图像的空间结构,而 Canny 版本则利用边缘检测技术来保持源图像的结构特征,使得用户可以根据不同需求选择合适的控制方式。

这两个模型都具有以下特点:

  • 顶级的输出质量和细节表现
  • 出色的提示遵循能力,同时保持源图像的结构布局
  • 使用引导蒸馏技术训练,提高效率
  • 开放权重供社区研究使用
  • 提供 API 接口(pro 版)和开源权重(dev 版)

此外,Black Forest Labs 还提供了从完整模型中提取的 FLUX.1-Depth-dev-loraFLUX.1-Canny-dev-lora 适配器版本,它们可以应用于 FLUX.1 [dev] 基础模型,以较小的文件体积提供类似的功能,特别适合资源受限的环境。

本文将以分别以完整版本的 FLUX.1-Canny-devFLUX.1-Depth-dev-lora 为例,完成ComfyUI 中 Flux ControlNet 的工作流示例。

Metadata 中包含工作流 json 的图片可直接拖入 ComfyUI 或使用菜单 `Workflows` -> `Open(ctrl+o)` 来加载对应的工作流。 本篇示例中的图片包含对应模型的下载链接,直接拖入 ComfyUI 将会自动提示下载。

对于图像预处理器,你可以使用以下自定义节点来完成图像的预处理,在本示例中,我们将提供处理过的图片作为输入。

  • ComfyUI-Advanced-ControlNet
  • ComfyUI ControlNet aux

2.FLUX.1-Canny-dev 完整版工作流

2.1 工作流及相关素材

请下载下面的工作流图片,并拖入 ComfyUI 以加载工作流

ComfyUI 工作流 - ControlNet

请下载下面的图片,我们将使用它来作为输入图片

ComfyUI Flux.1 Canny Controlnet input

2.2 手动模型下载

如果你之前使用过[完整版本的 Flux 相关工作流](/zh-CN/tutorials/flux/flux-1-text-to-image),那么你仅需要下载 **flux1-canny-dev.safetensors** 这个模型文件。 由于你需要先同意 [black-forest-labs/FLUX.1-Canny-dev](https://huggingface.co/black-forest-labs/FLUX.1-Canny-dev) 的协议,所以请访问 [black-forest-labs/FLUX.1-Canny-dev](https://huggingface.co/black-forest-labs/FLUX.1-Canny-dev) 页面,确保你参照下图同意了对应的协议。 ![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/0612fb39b43e4e3ca802d6ac74fd1793.png)

完整模型列表:

  • clip_l.safetensors
  • t5xxl_fp16.safetensors
  • ae.safetensors
  • flux1-canny-dev.safetensors (请确保你已经同意了对应 repo 的协议)

安装aria2快速下载模型,几乎能将我家1000M的宽带跑满,每秒80~90M,接下来的介绍模型都会给出安装命令。

apt install aria2
aria2c https://huggingface.co/black-forest-labs/FLUX.1-Canny-dev/resolve/main/flux1-canny-dev.safetensors?download=true -o SourceCode/ComfyUI/models/diffusion_models/flux1-canny-dev.safetensors --auto-file-renaming=false --allow-overwrite=falsearia2c https://huggingface.co/black-forest-labs/FLUX.1-Depth-dev-lora/resolve/main/flux1-depth-dev-lora.safetensors?download=true -o SourceCode/ComfyUI/models/loras/flux1-depth-dev-lora.safetensors --auto-file-renaming=false --allow-overwrite=false

小技巧:你要是打不开https://huggingface.co,可以将其换成为https://hf-mirror.com/试一试
文件保存位置:

ComfyUI/
├── models/
│   ├── text_encoders/
│   │   ├── clip_l.safetensors
│   │   └── t5xxl_fp16.safetensors
│   ├── vae/
│   │   └── ae.safetensors
│   └── diffusion_models/
│       └── flux1-canny-dev.safetensors

2.3 按步骤完成工作流的运行

在这里插入图片描述

  1. 确保在Load VAE中加载了ae.safetensors
  2. 确保在Load Diffusion Model加载了flux1-canny-dev.safetensors
  3. 确保在DualCLIPLoader中下面的模型已加载:
    • clip_name1: t5xxl_fp16.safetensors
    • clip_name2: clip_l.safetensors
  4. Load Image节点中上传了文档中提供的输入图片
  5. 点击 Queue 按钮,或者使用快捷键 Ctrl(cmd) + Enter(回车) 来运行工作流

2.4 开始你的尝试

尝试使用FLUX.1-Depth-dev 模型完成 Depth 版本的工作流

你可以使用下面的图片作为输入
ComfyUI 室内深度图

或者借助下面自定义节点中完成图像预处理:

  • ComfyUI-Advanced-ControlNet
  • ComfyUI ControlNet aux

3.FLUX.1-Depth-dev-lora 工作流

LoRA 版本的工作流是在完整版本的基础上,添加了 LoRA 模型,相对于完整版本的 Flux 工作流,增加了对应 LoRA 模型的加载使用节点。

3.1 工作流及相关素材

请下载下面的工作流图片,并拖入 ComfyUI 以加载工作流

ComfyUI 工作流 - ControlNet

请下载下面的图片,我们将使用它来作为输入图片

ComfyUI Flux.1 Depth Controlnet input

3.2 手动模型下载

如果你之前使用过[完整版本的 Flux 相关工作流](/zh-CN/tutorials/flux/flux-1-text-to-image),那么你仅需要下载 **flux1-depth-dev-lora.safetensors** 这个模型文件。

完整模型列表:

  • clip_l.safetensors
  • t5xxl_fp16.safetensors
  • ae.safetensors
  • flux1-dev.safetensors
  • flux1-depth-dev-lora.safetensors

文件保存位置:

ComfyUI/
├── models/
│   ├── text_encoders/
│   │   ├── clip_l.safetensors
│   │   └── t5xxl_fp16.safetensors
│   ├── vae/
│   │   └── ae.safetensors
│   ├── diffusion_models/
│   │   └── flux1-dev.safetensors
│   └── loras/
│       └── flux1-depth-dev-lora.safetensors

3.3 按步骤完成工作流的运行

  1. 确保在Load Diffusion Model加载了flux1-dev.safetensors
  2. 确保在LoraLoaderModelOnly中加载了flux1-depth-dev-lora.safetensors
  3. 确保在DualCLIPLoader中下面的模型已加载:
    • clip_name1: t5xxl_fp16.safetensors
    • clip_name2: clip_l.safetensors
  4. Load Image节点中上传了文档中提供的输入图片
  5. 确保在Load VAE中加载了ae.safetensors
  6. 点击 Queue 按钮,或者使用快捷键 Ctrl(cmd) + Enter(回车) 来运行工作流

3.4 开始你的尝试

尝试使用FLUX.1-Canny-dev-lora 模型完成 Canny 版本的工作流

借助 ComfyUI-Advanced-ControlNet 或者 ComfyUI ControlNet aux 完成图像预处理

4.社区版本 Flux Controlnets

XLab 和 InstantX + Shakker Labs 已经为 Flux 发布了 Controlnet。

InstantX:

  • FLUX.1-dev-Controlnet-Canny
  • FLUX.1-dev-ControlNet-Depth
  • FLUX.1-dev-ControlNet-Union-Pro

XLab: flux-controlnet-collections

将这些文件放在 ComfyUI/models/controlnet 目录下。

你可以访问Flux Controlnet 示例来获取对应工作流图片,并使用这里的图片作为输入图片。


文章转载自:

http://XTyNxjBf.mdLqf.cn
http://XHcZazFd.mdLqf.cn
http://6wyaGKn5.mdLqf.cn
http://vVwtuykh.mdLqf.cn
http://sMLTcmWM.mdLqf.cn
http://0Ln6e1mH.mdLqf.cn
http://pMdtsA8J.mdLqf.cn
http://w3vv8Rd0.mdLqf.cn
http://iX0caze0.mdLqf.cn
http://Y39KPMNX.mdLqf.cn
http://bwq2MZ27.mdLqf.cn
http://L7wgk7NV.mdLqf.cn
http://uidzsA68.mdLqf.cn
http://Y8c6ANxd.mdLqf.cn
http://8JtwFZcL.mdLqf.cn
http://ZlZrXAYh.mdLqf.cn
http://uNVe9QD9.mdLqf.cn
http://nTTEokK8.mdLqf.cn
http://ehx8iNaJ.mdLqf.cn
http://rku82OSK.mdLqf.cn
http://XHsLbTHZ.mdLqf.cn
http://YgYiU55P.mdLqf.cn
http://kus6dnDY.mdLqf.cn
http://dMYsjRFc.mdLqf.cn
http://P7noV7Fu.mdLqf.cn
http://27rQOMAT.mdLqf.cn
http://XzcuaGmf.mdLqf.cn
http://5w5aPrBD.mdLqf.cn
http://8hnBuwtv.mdLqf.cn
http://ntF3UlSp.mdLqf.cn
http://www.dtcms.com/a/379227.html

相关文章:

  • 企业微信内部应用js-sdk使用流程
  • Java Spring Boot常见异常全解析:原因、危害、处理与防范
  • Qt加载百度地图详细流程(附带报错解决方法)
  • 3D渲染时GPU内存不足解决措施
  • MySQL什么操作会加锁?
  • 中州养老:华为云设备管理接口开发全流程
  • 探讨图片以Base64存数据库的合理性
  • MoonBit 再次走进清华:张宏波受邀参加「思源计划」与「程序设计训练课」
  • RabbitMQ如何实现消息的持久化?
  • Crawlergo安装全流程
  • 完全背包问题 - 动态规划最优解法(Java实现)
  • 如何选择合适的双轴倾角传感器厂家提升水平监测准确性?
  • 洛谷PP5318 查找文献 (深度搜索与广度搜索)详解
  • 手机云服务是什么意思?
  • Linux 基础操作全攻略:从文件解压到服务器管理
  • web:ts的类类型
  • 初识StarRocks
  • linux常见的基础命令及其作用
  • 12 Prompt 模板化与参数化
  • 自动化车间无线安灯呼叫系统解决方案
  • Oracle APEX 如何运行页面时跳过登录页
  • list容器
  • Docker Compose:轻松管理多容器应用
  • 云蝠智能大模型呼叫新模型上线,拥抱AGI
  • 网站SEO内部优化一般包括哪些内容和方法
  • 18j621-3通风天窗图集pdf(免费高清版)
  • 以下是UniApp启动速度优化的深度方案
  • GoogLeNet实战:用PyTorch实现经典Inception模块
  • verilog中task的使用
  • SpringDoc OpenAPI集成spring boot3