当前位置: 首页 > news >正文

千问图像编辑Qwen-image-Edit及Qwen-image-Edit-2509(编辑文字/外观编辑/语义编辑)

摘要:Qwen-Image-Edit 是基于 20B Qwen-Image 训练的 ComfyUI 图像编辑模型,支持语义编辑、外观编辑、中英精确文本编辑,需更新内核并安装配套模型。基础工作流类似 Qwen-Image,局部重绘用 “内补模型条件” 节点,多图编辑需联结图像并缩放尺寸。2509版是更新版本,新增直接多图编辑、增强单图一致性,原生支持 ControlNet等功能。

Qwen-Image-Edit是Qwen-Image的图像编辑模型,它基于20BQwen-Image模型训练而得。Qwen-Image-Edit模型可以实现精确的文本编辑,具备很强的文本渲染与编辑能力。同时Qwen-Image-Edit模型将输入图像输入到 Qwen2.5-VL(用于视觉语义控制)和 VAE 编码器(用于视觉外观控制),可以实现语义和外观编辑的双重能力。

本节内容所涉及所有模型文末网盘可进行下载。

使用前注意将comfyui内核更新至最新版本。

1 主要功能

(1)语义与外观编辑:支持低级视觉外观编辑(如添加、删除或修改元素,要求图像的其他所有区域保持完全不变)和高级视觉语义编辑(如 IP 创建、对象旋转和风格迁移,允许整体像素变化同时保持语义一致性)。

(2)精确文本编辑:支持中英双语文本编辑,允许直接在图像中添加、删除和修改文本,同时保留原始字体、大小和风格。

2 功能演示

Qwen-image-Edit模型的功能十分丰富,为了更加直观的感受模型功能与基础应用能力,官方对Qwen-image-Edit模型的功能作用做了部分展示,这里我们略作整理可以快速对模型功能进行了解。

2.1 语义编辑

语义编辑能力指在保留原始视觉语义的同时修改图像内容

案例1:主体一致性--制作原创IP编辑

案例2:新颖视图合成--视角转换

案例3:风格迁移--生成虚拟形象

2.2 外观编辑

外观编辑强调在保持图像某些区域完全不变的同时,添加、删除或修改特定元素

案例1:ai新增

案例2:ai消除

案例3:ai重绘

案例4:调整人物背景

案例5:传达模拟

2.3 文本编辑

(1)文字设计--支持中文字体

案例2:海报编辑--文本/元素修改

案例3:定点文字修复

3 模型下载

3.1 Qwen image edit模型

模型下载地址:https://huggingface.co/Comfy-Org/Qwen-Image-Edit_ComfyUI/tree/main/split_files/diffusion_models

共有bf16、fp8两个版本,根据电脑显存情况下载安装即可。

下图内容箭头所指20258发布的最初版本标注2509则是20259发布2509版本两个版本功能略有不同全面了解qwen image edit模型我们本段先下载最初版本,后文再对2509版本进行说明。

模型安装位置:../ComfyUI/models/diffusion_models

3.2 配套模型

VAE、text_encoders、loRA等配套模型与Qwen-image模型工作流共用,如已安装则无需再额外下载。未下载安装的,也可以查看前面Qwen-image模型相关内容。

(1)text_encoders模型下载链接:

https://huggingface.co/Comfy-Org/Qwen-Image_ComfyUI/tree/main/split_files/text_encoders

安装地址:ComfyUI/models/text_encoders

(2)VAE模型下载链接:

https://huggingface.co/Comfy-Org/Qwen-Image_ComfyUI/tree/main/split_files/vae

安装地址:../ComfyUI/models/vae/

(3)lora模型下载地址:

https://huggingface.co/lightx2v/Qwen-Image-Lightning/tree/main

安装目录:../ComfyUI/models/loras/

注:启用该lora时,步数设置为8,cfg设置为1

4 工作流应用

4.1 基础工作流应用

官方基础工作流示例如下图所示,该基础工作流的搭建逻辑与Qwen image模型基础工作流基本一致,以“图像输入”并通过“VAE编码”为latent来替代“空latent”输入,另在“模型采样算法AuraFlow”后添加一个“CFGNorm”节点。

CFGNorm节点:通过调整 CFG 参数的作用强度,平衡模型对提示词的遵循度与生成内容的自然度,避免因 CFG 过高导致生成图像生硬或细节失真。

对官方工作流按照逻辑顺序略作梳理获得整理后工作流如下:

如使用加速loRA,按照loRA说明修改步数及CFG参数即可。

4.2 edit 局部重绘工作流

Qwen-Image-Edit模型局部重绘工作流的搭建逻辑参考XL/FLUX等模型的局部重绘工作流,使用“内补模型条件”节点代替“VAE编码”节点,并输入遮罩节点即可。

下面的案例,使用右键“在遮罩编辑器中打开”手动添加遮罩。

4.3 双图编辑及多图编辑工作流

Qwen_image_edit模型支持双图输入或多图输入的图像编辑,且实测效果在多图编辑效果上较kontext模型似乎可以取得更好的效果。

工作流十分简单,仅在Qwen_image_edit模型基础工作流中通过“图像联结”节点增加输入的图像数量,另外在“图像联结”节点后添加“FluxKontextImageScale”节点用于调整输入图像的尺寸。

该方案的本质是在处理图像之前将不同的图像先联结成一张图像,再对这张图像的信息进行编辑,由此可见最初发布的Qwen_image_edit原始版本并不能直接进行双图或多图的编辑(至2509版本模型开始具备直接多图编辑功能)。

通过在“VAE编码”后添加“latent缩放”节点设置最终图像出图尺寸。

FluxKontextImageScale节点主要用于调整上下文图像的尺寸它能根据需求对输入的参考图像进行缩放处理,确保图像尺寸符合 Flux 模型的输入要求或适配生成任务的尺寸设定,帮助优化上下文信息在模型生成过程中的作用,提升图像生成时对参考图的匹配度和协调性。

三图等更多图像编辑工作流将“图像联结”节点调整为“图像联结(多个)”节点,输入需求数量的参考图像并按需设置好提示词。

5 Qwen-Image-Edit-2509

5.1 模型更新介绍

Qwen-Image-Edit-2509是 Qwen-Image-Edit模型20259迭代版本。根据官方说明与8月份发布的Qwen-Image-Edit相比,Qwen-Image-Edit-2509 的主要改进包括:

1)多图像编辑支持:该功能2509版本的主要更新不同于前期版本的多图编辑实际为处理拼接图像,2509版本可以直接进行多图编辑对于多图像输入,Qwen-Image-Edit-2509 基于 Qwen-Image-Edit 架构,并通过图像拼接进一步训练,以实现多图像编辑。它支持各种组合,如“人 + 人”、“人 + 产品”和“人 + 场景”。目前在1到3张输入图像时表现最佳。

下面图像2509模型官方展示的部分效果直接输入多图并通过文字指令对多图进行处理:

2)增强的单图像一致性:对于单图像输入,Qwen-Image-Edit-2509 显著提高了编辑的一致性,特别是在以下方面:

改进的人像编辑一致性:更好地保留面部身份,支持各种肖像风格和姿势变换;

改进的产品编辑一致性:更好地保留产品身份,支持产品海报编辑;

改进的文字编辑一致性:除了修改文字内容外,还支持编辑文字字体、颜色和材质;

3)原生支持 ControlNet:包括深度图、边缘图、关键点图等。

Qwen-Image-Edit-2509 的最终更新是原生支持常用的ControlNet图像条件,如关键点控制和草图:

5.2 模型下载

https://huggingface.co/Comfy-Org/Qwen-Image-Edit_ComfyUI/tree/main/split_files/diffusion_models

模型安装位置:../ComfyUI/models/diffusion_models

5.3 配套模型

VAE、text_encoders等配套模型上文

5.3.1 加速lora模型

模型地址

https://huggingface.co/lightx2v/Qwen-Image-Lightning/tree/main/Qwen-Image-Edit-2509

安装目录:../ComfyUI/models/loras/

注:启用该lora时,步数设置为8,cfg设置为1

5.4 工作流

5.4.1 官方基础工作流

官方版本基础工作流多图单图功能集中在同一工作流根据需要开启输入参考图数量即可

latent尺寸可以通过输入图像经过VAE编码导入K采样器也可以通过空latent”节点直接设置尺寸输入K采样器另外也提供了不同模型条件下步数CFG推荐设置

5.4.2 单图编辑基础工作流(整理版)

输入一张图像作为底图删除textencodeQwenimageEditPlus节点image2image3输入

通过"空latent"节点输入K采样器的latent从而自由调整出图尺寸工作流中默认增加一个获取图像尺寸”节点保持出图尺寸与输入图像一致需要改变时直接删除该节点即可

调整单图编辑基础工作流如下

5.4.3 局部重绘工作流

Edit-2509模型局部重绘工作流的搭建逻辑与原版edit模型一致,使用“内补模型条件”节点代替“VAE编码”节点,并输入遮罩节点即可。

下面的案例,使用右键“在遮罩编辑器中打开”手动添加遮罩。

5.4.4 多图编辑整理版)

多图编辑工作流直接官方基础工作流启用另外两个“加载图像”即可可以按照官方工作流图片直接通过VAE编码输入K采样器的latent也可以按照整理版直接通过“空latent节点输入K采样器latent用于设置出图尺寸

本节内容所涉及的所有模型均已存储在网盘,链接地址:

https://pan.quark.cn/s/59567de2bdfc#/list/share

comfyUI基础整合包,包含秋叶版绘世启动器及comfyui官方版共两个版本,适合Windows系统使用。网盘内压缩文件解压密码VX-huaqs123,为防止下载失败,可先转存再下载。软件均为整合包形式,无需安装,下载后打开文件夹,点击运行图标即可使用。

百度网盘链接: 

https://pan.baidu.com/s/1UVeWVFttiWOZEWHtnLav9A?pwd=886e 提取码: 886e 

夸克网盘链接:https://pan.quark.cn/s/f445b7325b47

    欢迎正在学习comfyui等ai技术的伙伴VX加 huaqs123 进入学习小组。在这里大家共同学习comfyui的基础知识、最新模型与工作流、行业前沿信息等,也可以讨论comfyui商业落地的思路与方向。 欢迎感兴趣的小伙伴,群共享资料会分享博主自用的comfyui整合包(已安装超全节点与必备模型)、基础学习资料、工作流等资源……

图片

    致敬每一位在路上的学习者,你我共勉!Ai技术发展迅速,学习comfyUI是紧跟时代的第一步,促进商业落地并创造价值是我们学习的最终目标。

 ——画青山Ai学习专栏———————————————————————————————

零基础学Webui:

https://blog.csdn.net/vip_zgx888/category_13020854.html

Comfyui基础学习与实操:

https://blog.csdn.net/vip_zgx888/category_13006170.html

comfyui功能精进与探索:

https://blog.csdn.net/vip_zgx888/category_13005478.html

系列专栏持续更新中,欢迎订阅关注,共同学习,共同进步!

————————————————————————————————————

http://www.dtcms.com/a/532355.html

相关文章:

  • 静态代理模式
  • 探索有效文章生成的技巧与方法
  • 库的认识和制作
  • 在线做英语题的网站html5手机网站返回顶部
  • 开源项目详解3-ParserSpel
  • 系统性学习C++-第八讲-vector类
  • 什么是Nginx?:掌握高性能 Web 服务器核心技术
  • 江西网站开发公司模板网婚纱
  • 快速搭建Docker私有仓库指南
  • 网站禁用右键wordpress mycred汉化
  • 音视频处理(二): 一文讲清楚音频处理流程:采样、压缩和播放
  • 基于单片机的篮球比赛计时与比分控制系统设计
  • C++容器set
  • 网站建设主机耗电量怎么写代码自己制作网站
  • 超越低功耗:TMS320C6000 DSP的能效架构设计与IoT节点部署实践
  • 西安网站开发工资首都之窗门户网站首页
  • 中药电商平台是什么?主要具有哪些创新特征与应用场景?
  • Python模块(Module)详解:从基础使用到工程化实践
  • DTD 属性详解
  • 随身WiFi助手
  • 安卓网络请求详解:Retrofit + OkHttp 高效通信方案
  • centos建设网站营销系统平台
  • 华为OD机试双机位A卷 - 统计差异值大于相似值二元组个数 (C++ Python JAVA JS GO)
  • bug:realsense-viewer 找不到已识别的设备
  • Mac安装VisualVM 2.2启动闪退
  • 在macOS上搭建C#集成开发环境指南
  • 郑州市城乡建设规划网站苏州园区两学一做网站
  • 音乐网站 模板手游app平台排行榜
  • vue通信加密解密完整方案实现
  • 大模型模板输出与优化技术指南