当前位置: 首页 > news >正文

Comfyui加载图像编辑Qwen-Image-Edit工作流之Windows篇

阿里巴巴 通义千问团队发布并开源了 Qwen-Image-Edit 图像编辑大模型,它是基于 20BQwen-Image 模型进一步训练,成功将 Qwen-Image 的文本渲染特色能力拓展到编辑任务上,以支持精准的文字编辑。此外,Qwen-Image-Edit 将输入图像同时输入到 Qwen2.5-VL(获取视觉语义控制)和 VAE Encoder(获得视觉外观控制),以同时获得语义/外观双重编辑能力。

  • 精准文字编辑: Qwen-Image-Edit 支持中英双语文字编辑,可以在保留文字大小/字体/风格的前提下,直接编辑图片中文字,进行增删改。
  • 语义/外观 双重编辑: Qwen-Image-Edit 不仅支持 low-level 的视觉外观编辑(例如风格迁移,增删改等),也支持 high-level 的视觉语义编辑(例如 IP 制作,物体旋转等)
  • 强大的跨基准性能表现: 在多个公开基准测试中的评估表明,Qwen-Image-Edit 在编辑任务中均获得 SOTA,是一个强大的图像生成基础模型。

下载模型

对于国内的朋友,可以在国内镜像下载 Qwen-Image-Edit 模型: https://hf-mirror.com/Comfy-Org/Qwen-Image-Edit_ComfyUI/tree/main/split_files/diffusion_models

在这里插入图片描述

LoRA

  • Qwen-Image-Lightning-4steps-V1.0.safetensors

在这里插入图片描述

Text encoder

  • qwen_2.5_vl_7b_fp8_scaled.safetensors

在这里插入图片描述

VAE

  • qwen_image_vae.safetensors

在这里插入图片描述

等以上模型都下载完成后,按以下存放路径,拖入到 Comfyui 对应的文件夹内。

📂 ComfyUI/
├── 📂 models/
│ ├── 📂 diffusion_models/
│ │ └── qwen_image_edit_fp8_e4m3fn.safetensors
│ ├── 📂 loras/
│ │ └── Qwen-Image-Lightning-4steps-V1.0.safetensors
│ ├── 📂 vae/
│ │ └── qwen_image_vae.safetensors
│ └── 📂 text_encoders/
│ └── qwen_2.5_vl_7b_fp8_scaled.safetensors

加载工作流

可以从 Comfyui 文档中获取 Qwen-Image-Edit 工作流。

https://docs.comfy.org/zh-CN/tutorials/image/qwen/qwen-image-edit

在这里插入图片描述

将以上的工作流直接拖入 Comfyui 中,或者点击 下载 JSON 格式工作流文件,而后同样的拖入到 Comfyui 界面中。

在这里插入图片描述

注意:Comfyui 需要更新到最新版本,否则的话,是找不到 TextEncodeQwenImageEdit 这个节点的!

去除了原图中的文字及按钮,最终结果还是很丝滑啊!

在这里插入图片描述

那么,现在该试一下中文提示词是怎么样的效果?

先是上传一张带有 https://qiucode.cn 以及暗绿色的树叶小图标的水印图,目标是去除该 水印

Prompt(提示词)

移除图中的“https://qiucode.cn" 文字,以及那个树叶的小图标,不要改变原图的整体UI。

在这里插入图片描述

哇塞,最终按我的意愿,去除了 https://qiucode.cn 以及那个树叶小图标的水印。

http://www.dtcms.com/a/341731.html

相关文章:

  • C++之多态(从0到1的突破)
  • 【clion】cmake脚本1:调试脚本并构建Fargo项目win32版本
  • python 可迭代对象相关知识点
  • “无纸化办公”加速推进,房产证智能识别技术或成行业标配
  • Linux高效备份:rsync + inotify实时同步
  • 服务器硬盘进行分区和挂载
  • SpringBoot3后端项目介绍:mybig-event
  • 【MySQL的卸载】
  • 5.k8s控制器-Replicaset-Deployment、pod 反亲和性
  • VLN领域的“ImageNet”打造之路:从MP3D数据集、MP3D仿真器到Room-to-Room(R2R)、RxR、VLN-CE
  • Adobe Acrobat 表单创建与设置
  • 8.20 打卡 DAY 47 注意力热图可视化
  • 不会写 SQL 也能出报表?积木报表 + AI 30 秒自动生成报表和图表
  • JVM讲解
  • leetcode7二分查找_69 and 34
  • Linux正则表达式
  • 2D水平目标检测数据增强——旋转任意指定角度
  • RK3568 Linux驱动学习——设备树下 LED 驱动
  • Redisson最新版本(3.50.0左右)启动时提示Netty的某些类找不到
  • PowerShell脚本检查业务健康状态
  • 解决Docker 无法连接到官方镜像仓库
  • Lecture 6 Kernels, Triton 课程笔记
  • JVM基础知识总结
  • Docker 核心技术:Linux Cgroups
  • GDB 的多线程调试
  • 针对具有下垂控制光伏逆变器的主动配电网络的多目标分层协调电压/无功控制方法的复现
  • 音频读写速度优化 音频格式
  • Transformer内容详解(通透版)
  • pip install -e中e 参数解释
  • 八辊矫平机·第三篇