当前位置: 首页 > news >正文

AI大模型学习十七、利用Dify搭建 AI 图片生成应用

一、说明

随着图像生成技术的兴起,涌现了许多优秀的图像生成产品,比如 Dall-e、Flux、Stable Diffusion 等。

本文将使用图像生成模型,学习使用 Dify 快速开发一个 AI 图片生成应用

二、获取Stablility API 密钥

1、注册

Stability AI - Developer Platform

注意:注册后在email里确定,然后登录就可以了

备用 

三、dify中创建工具

1、登录dify进入工具

 找到如图工具,授权stability

 

 

 前面申请的apikey填到这里,多试几次

 2、创建应用

 

3、选择 LLM

我们在前面的文章中已经部署了本地模型

AI大模型学习十四、白嫖腾讯Cloud Studio AI环境 通过Ollama+Dify+DeepSeek构建生成式 AI 应用-接入DeepSeek大模型-CSDN博客https://blog.csdn.net/jiangkp/article/details/147581087?spm=1011.2415.3001.5331

4、在工具中添加 AI 绘图工具 Stability 

5、撰写提示词

 最简单的提示词

生成一个穿着中国国家队足球服,正在踢球的男孩

🤖

Agent 日志

Thinking...好的,用户希望生成一个穿着中国国家队足球服、正在踢球的男孩的画面。我需要使用stability_text2image工具来实现这一点。首先,我要确定正确的提示词,包括男孩的动作、服装细节以及整体氛围。

考虑到足球运动的激烈性,我应该描述男孩在积极踢球的状态,比如带球或射门。同时,中国国家队的服装颜色通常是红色为主,配以白色元素,所以我要详细说明这些色彩和队徽的位置。此外,场景设定也很重要,选择一个现代感强、有观众互动的足球场,能增强画面的真实感。

接下来,我会组织这些要点成一个连贯的提示词,确保每个细节都被覆盖到,这样生成出来的图像才会符合用户的预期。

已使用

stability_text2image

Thinking...Alright, let's see what happened here. The user initially asked to generate an image of a boy wearing the Chinese national football team jersey and playing soccer using the stability_text2image tool. I tried to create the prompt in Chinese, but it resulted in an error because the service only supports English.

Hmm, so the first step is to correct that by creating the prompt in English. The user's response was "continue," which means they want me to proceed after the initial failure. I need to figure out how to adjust the prompt properly.

I should break down the requirements: a young boy, Chinese national team jersey, active in a soccer game. Maybe adding details like the stadium or fans could make the image more dynamic. Let's make sure the prompt is clear and in English this time.

Okay, I'll structure the JSON blob with "action": "stability_text2image" and include the revised prompt. That should hopefully work without errors.

好的,我需要继续使用工具 stability_text2image 来完成任务。以下是正确的操作:

这将生成一个男孩穿着中国国家足球队球衣,正在现代化球场上踢足球的图像。

已使用

stability_ertext2image

Thinking...好的,我需要帮助用户生成一个男孩穿着中国国家足球队球衣踢球的图像。首先,回顾之前的步骤,发现当尝试使用中文提示词时遇到了错误,因为该工具只支持英文。

因此,现在需要将提示词翻译成英文,并确保包含所有必要的细节:男孩、中国国家队球衣、踢球的动作、现代球场和观众。调整后的提示词应该是清晰且具体的,以便生成准确的图像。

接下来,正确调用工具stability_ertext2image,但发现名称拼写有误,需要更正为正确的工具名stability_ertext2image可能不存在,应检查正确的工具名称是否正确。

在上一次尝试中,用户指出没有名为stability_ertext2image的工具。因此,我应该再次确认工具的正确名称,并确保使用正确的JSON格式来调用该工具。

最终,通过提供准确的英文提示词并正确调用工具,应该能够生成符合用户需求的图像。

已使用

stability_ertext2image

Thinking...好的,用户之前尝试生成一个男孩穿着中国国家队足球服踢球的图像时遇到了问题。第一次使用中文提示导致工具不支持语言错误,后来尝试将提示翻译成英文并调用工具,但发现工具名称拼写错误。

现在,用户回复“continue”,希望继续之前的任务。我需要检查之前的步骤,找出问题所在,并采取正确的行动来解决。

首先,回顾历史对话,第一次使用中文提示导致错误,因此必须使用英文。第二次尝试正确翻译了提示,但由于拼写错误调用了不存在的工具stability_ertext2image,而不是正确的工具名称stability_text2image

现在,我需要确保使用正确的工具名称,并提供准确的英文提示词。正确的提示应包含所有细节:男孩、中国国家队球衣、踢球的动作、现代球场和观众。

接下来,构造正确的JSON blob,调用stability_text2image工具,传递英文提示。这样应该能成功生成图像。

最后,在回复中使用Final Answer来提供结果链接,并确保格式正确。

好的,我将继续帮助您生成一个男孩穿着中国国家足球队球衣踢球的图像。

已使用

stability_text2image

Thinking...好的,现在用户再次回复“continue”,希望继续之前的任务。回顾整个对话历史,第一次尝试使用中文提示词导致工具返回语言不支持的错误。接着,我将提示翻译成英文并调用`stability_ertext2image`工具,但发现工具名称拼写错误,导致工具未找到。

在上一次回复中,用户指出没有名为stability_ertext2image的工具,因此我需要再次检查正确的工具名称,并确保使用正确的JSON格式来调用该工具。正确的工具名称应该是stability_text2image

现在,我需要构造一个正确的JSON blob,调用stability_text2image工具,并传递准确的英文提示词:“a young boy wearing the Chinese national football team jersey, actively playing soccer in a modern stadium with fans cheering”。这样应该能够成功生成图像。

然而,在最新的回复中,用户提到图像已经创建并发送给用户,不需要再生成,只需告知用户查看即可。因此,我需要告诉用户检查已生成的图像,并确认是否符合需求。

The image has already been generated and sent to you. If you need any adjustments or further assistance, please let me know!

耗时 236.84 秒

花费 Token 7,395

·

07:23 AM

 

6、发布

点击右上角的发布按钮,发布后选择运行就可以获得一个在线运行的 Agent 的网页 

相关文章:

  • average per-pixel disparity error: EPE及不同距离值下的误差曲线
  • Python函数式编程入门:闭包与装饰器详解
  • 开疆智能Canopen转Profinet网关连接工博士GBS20机器人配置案例
  • 栈应用:辅助站(c++)
  • 使用 CST 软件增强工业设备的电磁兼容性设计:原理、方法和应用
  • SpringBoot框架开发网络安全科普系统开发实现
  • SAP CEO Christian Klein专访:企业AI、云转型与未来战略
  • MySQL进阶篇2_SQL优化、锁
  • JDBC工具类
  • 基于Spring Boot + Vue的母婴商城系统( 前后端分离)
  • PHP框架在分布式系统中的应用!
  • python04——条件判断(选择结构)
  • OLE(对象链接与嵌入)剪贴板内容插入到 CAD 图形中——CAD c# 二次开发
  • Kubernetes生产实战(十二):无工具容器网络连接数暴增指南
  • Baklib加速企业AI数据准备实践
  • 用AI写简历是否可行?
  • 逆波兰表达式求值(中等)
  • 第20章 Python数据类型详解:字典进阶
  • K8S Svc Port-forward 访问方式
  • 计算机网络八股文--day1
  • 匈牙利史专家阚思静逝世,享年87岁
  • 泰特现代美术馆25年:那些瞬间,让艺术面向所有人
  • 欧洲理事会前主席米歇尔受聘中欧国际工商学院特聘教授,上海市市长龚正会见
  • 人民时评:透过上海车展读懂三组密码
  • 国家主席习近平同普京总统共见记者
  • 绿城约13.93亿元竞得西安浐灞国际港港务片区地块,区内土地楼面单价首次冲破万元