当前位置: 首页 > news >正文

第三课:Stable Diffusion图生图入门及应用

文章目录

  • Part01 图生图原理
  • Part02 图生图基本流程
  • Part03 随机种子作用解析
  • Part04 图生图的拓展应用

Part01 图生图原理

  • 当提示词不能足够表达用户需求的时候,加入图片能让AI更好的理解你的想法
  • 图片上的像素信息会在加噪和去噪的过程中,作为一种特征反映到最终的成品上

Part02 图生图基本流程

  • 导入图片:拖入或者点击插入图片的位置
  • 书写提示词:需要描述更多的内容性提示词,让AI更好的理解图片。如果不加入提示词,AI会没法充分理解图片含义。书写提示词的方法在第二课。
  • 参数调整:大部分都和文生图一样,这边多了重绘幅度,表示和原图有多像,重绘幅度越高,偏离原图越大。重绘幅度0.6,可以生成漫画效果。需要自己尝试找到平衡点
  • 生成图像的分辨率一般需要和输入图像一样,如果输入的很大,需要按比例折算到自己的设备能输出的尺寸,否则有可能爆显存。下面的拉伸,裁剪和填充可以帮你处理图片。直接缩放(放大潜变量)一般不推荐。

Part03 随机种子作用解析

  • AI生成图像是随机的,每一次生成有自己一套的描绘方式,这种描绘方式记录成随机数,也就是随机种子。
  • 使用同一个随机种子,生成的图像会有很多相似之处。
  • 随机种子如果是随机数或者-1,则类比抽卡过程。
  • 循环按钮作用是恢复上一次的随机种子。
  • 从图库浏览器,找到上一次生成图片,右侧参数可以找到图片的随机种子。

Part04 图生图的拓展应用

  • 导入不是人像的照片,但是用人物形象去描绘他,可以实现静物或者景象的拟人化。
  • 导入二次元的照片,选择偏真实的模型,然后用真实质感的提示词进行约束,可以变成三次元真人。如果加入第四节课的LoRa,会变得更真实。
  • 用Photoshop搭建图片框架,再用图生图重绘。
http://www.dtcms.com/a/92027.html

相关文章:

  • 跨语言微服务架构(Java、Python)——“API中台”
  • SQL小菜之TOP N查找问题
  • 【SUNO】【AI作词】【提示词】
  • 徘徊检测:视觉分析技术的安防新方向
  • ROS2 humble .launch.py启动文件编写
  • QML输入控件: Dial(1)
  • OLED 播放 GIF图片 Adruino
  • QT高效文件I/O编程--实用指南与最佳实践
  • 基于Spring Boot的网上购物商城系统的设计与实现(LW+源码+讲解)
  • c++:封装红黑树实现map与set
  • NVM安装速通使用手册(Windows版)NVM管理node版本命令手册 NVM使用手册
  • openmmlab介绍 一下
  • 大模型在原发性肺脓肿预测及治疗方案制定中的应用研究
  • Nuxt出现Error: Failed to download template from registry
  • 347 前k个高频元素
  • cli命令编写
  • OpenGL(三)管线介绍和三角形绘制
  • C++特殊类的设计
  • 二叉树相关算法实现:判断子树与单值二叉树
  • 线程未关闭导致资源泄漏
  • Halcon找圆心
  • c++some
  • 如何为你的github开源项目选择合适的开源协议?
  • Go 1.24 新特性解析:泛型类型别名、弱指针与终结器改进
  • HTTP抓包Websocket抓包(Fiddler)
  • tar包部署rabbitMQ
  • 进阶版孟德尔随机化方法!遗传变异聚类+异质性检验,避免水平多效性带来的假阳性结果(PCMR)
  • C++ 命名空间
  • 【neo4j数据导出并在其他电脑导入】
  • SQL问题分析与诊断(8)——前提