当前位置：首页 > news >正文

Dify + Stable Diffusion实现文生图工作流【两种方式】

news 2025/10/29 6:22:35

一、引言

最近在学习Dify工作流的一些玩法，下面将介绍一下Dify + Stable Diffusion实现文生图工作流的两种方式以及基础的应用方法。

Dify AI是一款强大的LLMOps（Language Model Operations）平台，专为用户提供便捷的人工智能应用程序开发体验。该平台支持GPT系列模型和其他模型，适用于各种团队，无论是用于内部还是外部的AI应用程序开发。它结合了后端即服务和LLMOps的概念，使开发人员能够快速构建生产级生成AI应用程序。即使是非技术人员也可以参与人工智能应用的定义和数据操作。

Stable Diffusion是2022年发布的深度学习文本到图像生成模型，它主要用于根据文本的描述产生详细图像。

Dify与Stable Diffusion的协同价值

Dify作为低代码AI开发平台的优势：可视化编排、API快速集成
Stable Diffusion的核心能力：高效文生图、多模态生成
二者结合的意义：降低AI绘画开发门槛，加速创意落地

二、文生图工作流（SD接口）

2.1 实现流程

通过大模型将自然语言转换成SD提示词；

系统提示词

# 角色
你是一个专业的SD提示词提取专家，擅长从描述性画面中精准提取SD提示词。

## 技能
### 技能 1: 提取SD提示词
1. 当用户提供描述性画面时，仔细分析画面内容。
2. 精准提取其中与SD相关的提示词。
3. 将提取的提示词清晰罗列展示给用户。
4. 提示词内容用逗号隔开。
===回复示例===
1gril,street
===示例结束===
### 技能 2: 提示词转换
将具体的提示词转换成stable diffusion能够识别的字符

## 限制:
- 只围绕从描述性画面中提取SD提示词展开，拒绝回答无关话题。
- 所输出的内容必须清晰罗列展示提取的提示词，不能偏离框架要求。

调用SD接口实现文生图；

body参数

{
"prompt": "{{#1743499272369.text#}}",
"negative_prompt": "(((headwear))),(((censored))),(Multiple Girls),(bad hands),(bad feet),(bad legs),(bad penis),(Extra legs),(missing legs),(worst quality:1.4),(norma quality:1.4),lowres,extra arms,bad body,too many fingers,extra legs,malformed hands,mutated hands and fingers,disconnected limbs,nsfw",
"sd_vae_name": "vae-ft-mse-840000-ema-pruned.safetensors",
"steps": 20,
"sd_model_name": "真实系_majicmixRealistic_v6"
}

提取返回的base64编码格式的图片字符串；

通过代码块进行格式化

function main({body}) {
    return {
        result:'data:image/png;base64,'+ JSON.parse(body)["images"][0]
    }
}

用该字符串构建markdown格式的字符串；
结果输出。

2.2 工作流流程

在这里插入图片描述

2.3 演示效果

在这里插入图片描述
使用这种调用接口的方式相对来说比较麻烦，调用接口将返回图片的base64编码字符串拼接成markdown格式并显示，下面将使用Dify内置的Stable Diffusion工具来实现文生图功能

三、文生图工作流（SD工具）

3.1 实现流程

通过大模型将自然语言转换成SD提示词（这一步跟前一种方式一样）
使用Stable Diffusion工具生成图片，生成图片会以文件的形式返回；
使用该工具首先需要进行授权，即配置SD服务地址和模型

使用这个工具可以非常方便的配置图片宽高、负向提示词等参数

在这里插入图片描述

结果输出

3.2 工作流流程

在这里插入图片描述

3.3 演示效果

在这里插入图片描述

四、文生图聊天机器人

将文生图工作流配置成工具
创建聊天机器人Agent
添加自定义工具

配置提示词

演示效果

查看全文

http://www.dtcms.com/a/131138.html

ffmpeg 切割视频失败 ffmpeg 命令参数 -vbsf 在新版本中已经被弃用，需要使用 -bsf:v 替代

SD+融合ControlNet，扩散模型V1.5+约束条件边缘图+颜色图实现服装图像生成：定量对比试验结果+分析

【测试】-- 测试分类

pg_rman备份pg数据库（在备库执行）

权限管控与数据安全：衡石ChatBot在钉钉中的合规部署指南

基于Cline和OpenRouter模型进行MCP实战

通过平台大数据智能引擎及工具,构建设备管理、运行工况监测、故障诊断等应用模型的智慧快消开源了

常见的HTTP状态码有哪些

GDB 调试命令详解：高效掌握常用调试技巧

构件与中间件技术：概念、复用、分类及标准全解析

IS-IS度量值

一、Appium环境安装

Redis之分布式锁

Windows Server 2019 安装 Docker 完整指南

0基础学前端---JS【计算机基础、变量、数据类型】

学习海康VisionMaster之平行线计算

3 VS Code 深度配置与优化指南：settings.json 详解、快捷键大全、实用插件推荐及离线安装方法

设计模式实践：模板方法、观察者与策略模式详解

ES6学习03-字符串扩展（unicode、for...of、字符串模板）和新方法（）

大模型微调数据集怎么搞？基于easydataset实现文档转换问答对json数据集！

Scala day4(tuple, set and map)

echarts 图表

【阶次跟踪】变转速阶次包络谱

海洋垃圾分割数据集labelme格式3110张8类别

从案例看建设工程领域居间合同的法律效力

洛谷P8749 [蓝桥杯 2021 省 B] 杨辉三角形

关于无线网络安全的基础知识，涵盖常见威胁、防护措施和实用建议

简单记录一下Android四大组件

MySQL部分总结

07.unity 游戏开发-粒子系统

一、引言

二、文生图工作流（SD接口）

2.1 实现流程

2.2 工作流流程

2.3 演示效果

三、文生图工作流（SD工具）

3.1 实现流程

3.2 工作流流程

3.3 演示效果

四、文生图聊天机器人

相关文章：