当前位置: 首页 > news >正文

dify + ollama + deepseek-r1+ stable-diffusion 构建绘画智能体

故事背景

stable-diffusion 集成进 dify 后,我们搭建一个小智能体,验证下文生图功能

业务流程

用户输入文本
LLM根据用户诉求,
生成文生图英文prompt
根据文生图prompt调用
stable-diffusion 生成图片
输出图片和英文prompt

节点图

在这里插入图片描述

节点说明

LLM

LLM 节点采用 deepseek-r1 模型,提示词为:根据用户输入的文本,理解并转换成文生图提示词,且提示词必须是英文,输出​内容不带思考过程,以文本输出
在这里插入图片描述

代码执行

由于大模型生成的文本中,还存在思考过程,这里由于是demo,直接字符串截取,获取英文prompt

验证效果

在这里插入图片描述
LLM节点输出的数据为

{
  "text": "<details style=\"color:gray;background-color: #f8f8f8;padding: 8px;border-radius: 4px;\" open> <summary> Thinking... </summary>\n好的,我现在需要处理用户的查询。用户提供了一段中文文本:“《红楼梦》中的林黛玉”,然后要求我将其转换为用于文生图的提示词,并且这个提示词必须是英文,同时不带任何思考过程,直接输出结果。\n\n首先,我要理解用户的需求。他们希望将中文描述转换成英文的提示词,用于生成图像。这可能是因为他们正在使用一个支持英文提示词的绘图工具或API,比如DALL·E、MidJourney或者Stable Diffusion等。这些工具通常需要明确且详细的英文提示词来生成高质量的图像。\n\n接下来,我分析用户提供的文本:“《红楼梦》中的林黛玉”。这句话提到了两个关键元素:一是作品名称《红楼梦》,二是人物林黛玉。因此,提示词需要包含这两个信息点,并且可能还需要一些额外的描述来帮助生成更准确的画面。\n\n考虑到绘图模型通常对细节和氛围比较敏感,我应该在提示词中添加一些环境或风格的描述。例如,“古典中国文学作品”可以传达出《红楼梦》的文化背景;“忧郁而优雅”则能描绘林黛玉的性格特点;再加上“传统服饰”来具体化人物的形象。\n\n然后,我会把这些元素组合成一个连贯的英文句子。确保用词准确且自然流畅,避免过于生硬或直译。例如,“A melancholic and elegant character from the classic Chinese literary work 'Dream of the Red Chamber'”能够很好地表达林黛玉的角色特质和作品背景;“dressed in traditional Chinese attire”则进一步细化了人物的外貌特征。\n\n最后,检查整个提示词是否完整,是否有遗漏的关键信息。确保没有语法错误,并且每个部分都清晰传达给绘图模型,以便生成符合预期的画面。\n</details>\n\nA melancholic and elegant character from the classic Chinese literary work \"Dream of the Red Chamber\", dressed in traditional Chinese attire",
  "usage": {
    "prompt_tokens": 45,
    "prompt_unit_price": "0",
    "prompt_price_unit": "0",
    "prompt_price": "0E-7",
    "completion_tokens": 402,
    "completion_unit_price": "0",
    "completion_price_unit": "0",
    "completion_price": "0E-7",
    "total_tokens": 447,
    "total_price": "0E-7",
    "currency": "USD",
    "latency": 42.33978042751551
  },
  "finish_reason": "stop"
}

相关文章:

  • Pytorch xpu环境配置 Pytorch使用Intel集成显卡
  • 单粒子翻转对FPGA的影响及解决方法
  • windows下安装pipx
  • 【JAVA架构师成长之路】【JVM实战】第2集:生产环境内存飙高排查实战
  • 视频输入设备-V4L2的开发流程简述
  • 交叉编译openssl及curl
  • 【Mac】MacOS系统下常用的开发环境配置2025版
  • 【论文阅读】多模态——LSeg
  • 使用 Elasticsearch 进行集成测试初始化​​数据时的注意事项
  • 9. Flink的性能优化
  • 训练 FLUX LoRA模型安装与部署
  • 高频 SQL 50 题(基础版)| 高级字符串函数 / 正则表达式 / 子句:1667. 修复表中的名字、1527. 患某种疾病的患者、196. 删除重复的电子邮箱、176. 第二高的薪水、...
  • 【UI自动化实现思路第二章】OCR 图片文字识别方法
  • NO2.C++语言基础|C++和Java|常量|重载重写重定义|构造函数|强制转换|指针和引用|野指针和悬空指针|const修饰指针|函数指针(C++)
  • 算法提升第一章:基础算法总结
  • 【JAVA架构师成长之路】【JVM实战】第1集:生产环境CPU飙高排查实战
  • DeepSeek本地调用,集成到自己的平台中,做二次集成
  • 2025-03-06 学习记录--C/C++-C 库函数 - strcat()、strncpy()
  • 【每日学点HarmonyOS Next知识】Web上传文件、监听上下左右区域连续点击、折叠悬停、字符串相关、播放沙盒视频
  • 微服务架构下的 Node.js
  • 那些钓鱼网站是怎么做的/软文写作范例大全
  • 简单的英文网站模板/郑州今日头条
  • 设计素材网站集合/网络营销的策略
  • 什么网站做兼职最好/太原seo团队
  • 360doc 网站怎么做/精准客户资源购买
  • 西安网站建设排行榜/sem工资