当前位置：首页 > news >正文

千问图像编辑Qwen-image-Edit及Qwen-image-Edit-2509（编辑文字/外观编辑/语义编辑）

news 2025/10/27 8:07:44

摘要：Qwen-Image-Edit 是基于 20B Qwen-Image 训练的 ComfyUI 图像编辑模型，支持语义编辑、外观编辑、中英精确文本编辑，需更新内核并安装配套模型。基础工作流类似 Qwen-Image，局部重绘用 “内补模型条件” 节点，多图编辑需联结图像并缩放尺寸。2509版是更新版本，新增直接多图编辑、增强单图一致性，原生支持 ControlNet等功能。

Qwen-Image-Edit是Qwen-Image的图像编辑模型，它基于20B的Qwen-Image模型训练而得。Qwen-Image-Edit模型可以实现精确的文本编辑，具备很强的文本渲染与编辑能力。同时，Qwen-Image-Edit模型将输入图像输入到 Qwen2.5-VL（用于视觉语义控制）和 VAE 编码器（用于视觉外观控制），可以实现语义和外观编辑的双重能力。

本节内容所涉及所有模型文末网盘可进行下载。

使用前注意将comfyui内核更新至最新版本。

1 主要功能

（1）语义与外观编辑：支持低级视觉外观编辑（如添加、删除或修改元素，要求图像的其他所有区域保持完全不变）和高级视觉语义编辑（如 IP 创建、对象旋转和风格迁移，允许整体像素变化同时保持语义一致性）。

（2）精确文本编辑：支持中英双语文本编辑，允许直接在图像中添加、删除和修改文本，同时保留原始字体、大小和风格。

2 功能演示

Qwen-image-Edit模型的功能十分丰富，为了更加直观的感受模型功能与基础应用能力，官方对Qwen-image-Edit模型的功能作用做了部分展示，这里我们略作整理可以快速对模型功能进行了解。

2.1 语义编辑

语义编辑能力指在保留原始视觉语义的同时修改图像内容。

案例1：主体一致性--制作原创IP编辑

案例2：新颖视图合成--视角转换

案例3：风格迁移--生成虚拟形象

2.2 外观编辑

外观编辑强调在保持图像某些区域完全不变的同时，添加、删除或修改特定元素。

案例1：ai新增

案例2：ai消除

案例3：ai重绘

案例4：调整人物背景

案例5：传达模拟

2.3 文本编辑

（1）文字设计--支持中文字体

案例2：海报编辑--文本/元素修改

案例3：定点文字修复

3 模型下载

3.1 Qwen image edit模型

模型下载地址：https://huggingface.co/Comfy-Org/Qwen-Image-Edit_ComfyUI/tree/main/split_files/diffusion_models

共有bf16、fp8两个版本，根据电脑显存情况下载安装即可。

下图内容箭头所指的为2025年8月发布的最初版本，标注有2509的则是2025年9月发布的2509版本，两个版本功能略有不同，为全面了解qwen image edit模型，我们本段先下载最初版本，后文再对2509版本进行说明。

模型安装位置：../ComfyUI/models/diffusion_models

3.2 配套模型

VAE、text_encoders、loRA等配套模型与Qwen-image模型工作流共用，如已安装则无需再额外下载。未下载安装的，也可以查看前面Qwen-image模型相关内容。

（1）text_encoders模型下载链接：

https://huggingface.co/Comfy-Org/Qwen-Image_ComfyUI/tree/main/split_files/text_encoders

安装地址：ComfyUI/models/text_encoders

（2）VAE模型下载链接：

https://huggingface.co/Comfy-Org/Qwen-Image_ComfyUI/tree/main/split_files/vae

安装地址：../ComfyUI/models/vae/

（3）lora模型下载地址：

https://huggingface.co/lightx2v/Qwen-Image-Lightning/tree/main

安装目录：../ComfyUI/models/loras/

注：启用该lora时，步数设置为8，cfg设置为1

4 工作流应用

4.1 基础工作流应用

官方基础工作流示例如下图所示，该基础工作流的搭建逻辑与Qwen image模型基础工作流基本一致，以“图像输入”并通过“VAE编码”为latent来替代“空latent”输入，另在“模型采样算法AuraFlow”后添加一个“CFGNorm”节点。

CFGNorm节点：通过调整 CFG 参数的作用强度，平衡模型对提示词的遵循度与生成内容的自然度，避免因 CFG 过高导致生成图像生硬或细节失真。

对官方工作流按照逻辑顺序略作梳理获得整理后工作流如下：

如使用加速loRA，按照loRA说明修改步数及CFG参数即可。

4.2 edit 局部重绘工作流

Qwen-Image-Edit模型局部重绘工作流的搭建逻辑参考XL/FLUX等模型的局部重绘工作流，使用“内补模型条件”节点代替“VAE编码”节点，并输入遮罩节点即可。

下面的案例，使用右键“在遮罩编辑器中打开”手动添加遮罩。

4.3 双图编辑及多图编辑工作流

Qwen_image_edit模型支持双图输入或多图输入的图像编辑，且实测效果在多图编辑效果上较kontext模型似乎可以取得更好的效果。

工作流十分简单，仅在Qwen_image_edit模型基础工作流中通过“图像联结”节点增加输入的图像数量，另外在“图像联结”节点后添加“FluxKontextImageScale”节点用于调整输入图像的尺寸。

该方案的本质是在处理图像之前将不同的图像先联结成一张图像，再对这张图像的信息进行编辑，由此可见最初发布的Qwen_image_edit原始版本并不能直接进行双图或多图的编辑（至2509版本模型开始具备直接多图编辑功能）。

通过在“VAE编码”后添加“latent缩放”节点设置最终图像出图尺寸。

FluxKontextImageScale节点：主要用于调整上下文图像的尺寸，它能根据需求对输入的参考图像进行缩放处理，确保图像尺寸符合 Flux 模型的输入要求或适配生成任务的尺寸设定，帮助优化上下文信息在模型生成过程中的作用，提升图像生成时对参考图的匹配度和协调性。

三图等更多图像编辑工作流：将“图像联结”节点调整为“图像联结（多个）”节点，输入需求数量的参考图像并按需设置好提示词。

5 Qwen-Image-Edit-2509版

5.1 模型更新介绍

Qwen-Image-Edit-2509是 Qwen-Image-Edit模型2025年9月的迭代版本。根据官方说明，与8月份发布的Qwen-Image-Edit相比，Qwen-Image-Edit-2509 的主要改进包括：

（1）多图像编辑支持：该功能是2509版本的主要更新，不同于前期版本的多图编辑实际为处理拼接图像，2509版本可以直接进行多图编辑。对于多图像输入，Qwen-Image-Edit-2509 基于 Qwen-Image-Edit 架构，并通过图像拼接进一步训练，以实现多图像编辑。它支持各种组合，如“人 + 人”、“人 + 产品”和“人 + 场景”。目前在1到3张输入图像时表现最佳。

下面的图像是2509版模型官方展示的部分效果，直接输入多图并通过文字指令对多图进行处理：

（2）增强的单图像一致性：对于单图像输入，Qwen-Image-Edit-2509 显著提高了编辑的一致性，特别是在以下方面：

改进的人像编辑一致性：更好地保留面部身份，支持各种肖像风格和姿势变换；

改进的产品编辑一致性：更好地保留产品身份，支持产品海报编辑；

改进的文字编辑一致性：除了修改文字内容外，还支持编辑文字字体、颜色和材质；

（3）原生支持 ControlNet：包括深度图、边缘图、关键点图等。

Qwen-Image-Edit-2509 的最终更新是原生支持常用的ControlNet图像条件，如关键点控制和草图：

5.2 模型下载

https://huggingface.co/Comfy-Org/Qwen-Image-Edit_ComfyUI/tree/main/split_files/diffusion_models

模型安装位置：../ComfyUI/models/diffusion_models

5.3 配套模型

VAE、text_encoders等配套模型同上文。

5.3.1 加速lora模型

模型地址：

https://huggingface.co/lightx2v/Qwen-Image-Lightning/tree/main/Qwen-Image-Edit-2509

安装目录：../ComfyUI/models/loras/

注：启用该lora时，步数设置为8，cfg设置为1

5.4 工作流

5.4.1 官方基础工作流

官方版本基础工作流中，将多图与单图功能集中在同一工作流中，根据需要开启输入的参考图数量即可。

latent尺寸可以通过输入图像经过VAE编码导入K采样器，也可以通过“空latent”节点直接设置尺寸再输入K采样器。另外也提供了不同模型条件下，步数和CFG值的推荐设置。

5.4.2 单图编辑基础工作流（整理版）

仅输入一张图像作为底图，删除textencodeQwenimageEditPlus节点中的image2和image3的输入。

通过"空latent"节点输入K采样器的latent，从而自由调整出图尺寸。工作流中默认增加一个“获取图像尺寸”节点，保持出图尺寸与输入图像一致，需要改变时直接删除该节点即可。

调整后单图编辑基础工作流如下：

5.4.3 局部重绘工作流

Edit-2509模型局部重绘工作流的搭建逻辑与原版edit模型一致，使用“内补模型条件”节点代替“VAE编码”节点，并输入遮罩节点即可。

下面的案例，使用右键“在遮罩编辑器中打开”手动添加遮罩。

5.4.4 多图编辑（整理版）

多图编辑工作流直接在官方基础工作流中启用另外两个“加载图像”即可。可以按照官方工作流将图片直接通过VAE编码后输入K采样器的latent，也可以按照整理版直接通过“空latent”节点输入K采样器的latent用于设置出图尺寸。

本节内容所涉及的所有模型均已存储在网盘，链接地址：

https://pan.quark.cn/s/59567de2bdfc#/list/share

comfyUI基础整合包，包含秋叶版绘世启动器及comfyui官方版共两个版本，适合Windows系统使用。网盘内压缩文件解压密码VX-huaqs123，为防止下载失败，可先转存再下载。软件均为整合包形式，无需安装，下载后打开文件夹，点击运行图标即可使用。

百度网盘链接:

https://pan.baidu.com/s/1UVeWVFttiWOZEWHtnLav9A?pwd=886e 提取码: 886e

夸克网盘链接：https://pan.quark.cn/s/f445b7325b47

欢迎正在学习comfyui等ai技术的伙伴VX加 huaqs123 进入学习小组。在这里大家共同学习comfyui的基础知识、最新模型与工作流、行业前沿信息等，也可以讨论comfyui商业落地的思路与方向。欢迎感兴趣的小伙伴，群共享资料会分享博主自用的comfyui整合包（已安装超全节点与必备模型）、基础学习资料、工作流等资源……