当前位置: 首页 > news >正文

【ComfyUI】Flux 扩展原始图像边界

今天展示的案例是一个基于 Flux 扩图 的 ComfyUI 工作流,它能够将原始图像进行外扩生成更大尺寸的画面。该流程利用了扩散模型与条件编码的结合方式,通过对加载图像的边缘填充与掩码重建,生成符合上下文语义的扩展内容。

在这里插入图片描述

在这里插入图片描述

在效果演示中,原图会自然地向四周延伸,保持风格与内容的统一,从而实现类似壁画、场景拼接或大幅插画的效果。

文章目录

  • 工作流介绍
    • 核心模型
    • Node 节点
  • 工作流程
  • 应用场景
  • 开发与应用

工作流介绍

该工作流主要围绕 Flux 填充模型 进行构建,结合 CLIP 文本编码器与 T5 语义编码,能够对输入的正向提示与负向提示进行解析,再通过采样器与解码器生成符合目标的扩展图像。整体流程从加载图片开始,经过外扩填充、掩码生成、条件编码和扩散推理,最终得到完整的大尺寸画面。这一过程不仅适合艺术创作中的背景延展,也能用于海报设计、漫画拼接和影视分镜扩展等场景。

在这里插入图片描述

核心模型

在工作流中,核心模型包括文本编码器、扩散模型和 VAE 解码器。文本编码部分由 CLIP 与 T5 双编码器完成,对提示词进行语义理解和潜在空间条件生成;扩散部分采用 Flux.1 Fill Dev 模型,专门针对 inpainting 与图像外扩任务进行优化;最后由 VAE 模型负责潜在向量到图像的还原,保证生成画面的清晰度与一致性。通过三者的协作,能够实现从文本到图像的精准引导与外扩生成。

模型名称说明
clip_l.safetensorsCLIP 文本编码模型,用于解析提示词并生成语义向量
t5xxl_fp16.safetensorsT5 大规模语言模型编码器,补充更细腻的语义信息
flux1-fill-dev.safetensorsFlux 填充扩散模型,专注图像外扩与修补生成
ae.safetensorsVAE 解码模型,将潜在空间数据转换为最终图像

Node 节点

该工作流由多个节点协同运行,完成从图像输入到结果保存的全过程。输入部分通过 LoadImage 节点加载原始图像,ImagePadForOutpaint 节点负责对图像进行四周填充并生成掩码区域;文本条件由 CLIP Text Encode(正向与负向提示)节点完成,再交由 FluxGuidance 节点进行条件优化;在模型推理阶段,UNETLoaderDifferentialDiffusion 节点构成主干扩散网络,结合 InpaintModelConditioning 节点处理带掩码的潜在向量;KSampler 节点则执行采样生成,VAEDecode 负责解码还原,最终由 SaveImage 节点输出生成结果。

节点名称说明
LoadImage加载原始输入图像
ImagePadForOutpaint对输入图像进行外扩填充并生成掩码
CLIP Text Encode (Positive/Negative Prompt)解析提示词,生成正负向条件编码
FluxGuidance对条件编码进行引导调整,强化语义控制
UNETLoader加载 Flux 扩散模型,作为主干网络
DifferentialDiffusion对扩散模型进行差分增强,提高生成稳定性
InpaintModelConditioning将掩码区域与条件输入结合,生成潜在向量
KSampler执行扩散采样过程,生成潜在图像结果
VAELoader / VAEDecode加载 VAE 并将潜在向量解码为最终图像
SaveImage保存生成的扩展图像结果

工作流程

整个工作流程围绕“加载图像—生成掩码—条件编码—扩散采样—解码输出”的主线展开。输入的原始图片通过加载节点进入流程,首先经过外扩填充以获得新的画布区域和对应的掩码;随后提示词经由双重文本编码器解析为潜在空间中的正负条件信息,并通过引导节点进一步强化语义控制;在扩散模型部分,UNet 网络与差分扩散机制协同作用,将带有掩码和条件输入的潜在表示转化为可生成的图像潜 latent;最后经过采样与 VAE 解码,得到扩展后的完整图像并保存。整个过程保持了原始画面的连贯性,同时在外扩区域引入合理的细节与内容。

流程序号流程阶段工作描述使用节点
1图像输入读取原始图像并准备扩展处理LoadImage
2画布扩展对输入图像进行外扩并生成掩码区域ImagePadForOutpaint
3文本条件编码正向与负向提示词,生成语义条件CLIP Text Encode (Positive/Negative)
4条件引导对生成的语义条件进行优化调整FluxGuidance
5模型加载调用 Flux 填充模型与差分扩散组件UNETLoader + DifferentialDiffusion
6潜在条件结合掩码区域与条件输入形成潜在向量InpaintModelConditioning
7扩散采样运行采样过程生成扩展潜在图像KSampler
8图像解码使用 VAE 解码潜在表示为最终图像VAELoader + VAEDecode
9结果保存输出并保存扩展后的图像结果SaveImage

应用场景

这一工作流适合在多个实际场景中应用。对于设计师而言,它能够在制作宣传海报、插画或游戏原画时轻松实现画面扩展,避免因分辨率限制带来的素材不足。对于漫画和影视分镜的创作者,该流程能将局部画面外扩成更完整的场景,保证连贯性并节省人工绘制成本。在日常使用中,也能将摄影作品延展成大尺寸的展示图,用于展览或装饰。其应用价值不仅体现在艺术创作的效率提升,还在于对图像生成技术的灵活运用,为跨领域创意提供更多可能性。

应用场景使用目标典型用户展示内容实现效果
海报与插画设计扩展画布,增强构图平面设计师宣传画、艺术插图获取高分辨率大幅作品
漫画与影视分镜补充场景画面,保持连续性漫画作者、影视创作者连贯的场景镜头快速生成完整画面
摄影扩展将照片扩展为大尺寸输出摄影师、展览布展人员摄影作品满足展览与装饰需求
游戏与虚拟场景制作完整背景与环境游戏原画师游戏场景素材提升沉浸感与画面表现力
创意实验探索 AI 外扩图像的艺术效果艺术爱好者、研究人员实验性艺术作品生成独特的创意画面

开发与应用

更多 AIGC 与 ComfyUI工作流 相关研究学习内容请查阅:

ComfyUI使用教程、开发指导、资源下载

更多内容桌面应用开发和学习文档请查阅:

AIGC工具平台Tauri+Django环境开发,支持局域网使用
AIGC工具平台Tauri+Django常见错误与解决办法
AIGC工具平台Tauri+Django内容生产介绍和使用
AIGC工具平台Tauri+Django开源ComfyUI项目介绍和使用
AIGC工具平台Tauri+Django开源git项目介绍和使用

http://www.dtcms.com/a/473803.html

相关文章:

  • 068B-基于R语言平台Biomod2集成模型的物种分布模型构建和数据可视化教程【2027】
  • Custom SRP 12 - HDR
  • 偏振相机是否属于不同光谱相机的范围内
  • 烟台房地产网站建设视频直播服务
  • SQL Server中alter对于表的常用操作
  • 学校网站建设报告九江 网站建设公司
  • Blender图片转3D模型智能插件 True Depth V2附使用教程
  • 【数据分享】中国土地利用数据(1980-2015)
  • 工信部网站备案通知怎么样免费给网站做优化
  • Differentially Private Synthetic Text Generation for RAG——论文阅读
  • SQL入门:流程控制函数全解析
  • php网站虚拟机价格电子商务网站建设的意义
  • 【AES加密专题】6.功能函数的编写(3)
  • Windows安装Apache Kafka保姆级教程(图文详解+可视化管理工具)
  • java集合类的底层类是哪个
  • Arbess从入门到实战(13) - 使用Arbess+GitLab+Gradle实现Java项目自动化部署
  • 类与对象--2
  • socket 传输结构体数据,另一端进行恢复
  • 2025年数据治理平台解决方案:让数据真正可用、可信、可运营
  • 网站建设公司 长春广州购物网站建设
  • Linux ARM QT FrameBuffer
  • 静态网站特点阿里云wordpress在哪里设置
  • MATLAB完整问卷调查数据分析(附完整代码)
  • Claude Code学习笔记(四)-助你快速搭建首个Python项目
  • 济南 制作网站 公司哪家好文登seo排名
  • Chrome 插件开发入门
  • 天津专业网站制作wordpress 多域名登陆
  • Docker简介及部署
  • 字符数组和字符串
  • 【TIDE DIARY 3】dify: chatflow; docker: exec