当前位置: 首页 > news >正文

代码讲解系列-CV(六)——视觉生成模型

文章目录

  • 一、Diffusers入门
    • 1.1 扩散模型
    • 1.2 Diffusers——扩散模型工具库
    • 1.3 Pipeline
  • 二、流水线解构
    • 2.1 扩散模型
    • 2.2 Scheduler
    • 2.3 Model
    • 2.4 Stable Diffusion
  • 三、训练扩散模型
    • 3.1 训练步骤
  • 四、微调
    • 4.1 IP-Adapter
  • 五、作业

一、Diffusers入门

1.1 扩散模型

产品:SD, Midjourney, Sora, Luma
在这里插入图片描述

1.2 Diffusers——扩散模型工具库

Guided Diffusion——最早的综合
Stable diffusion——之后
Huggingface: transformers——
Huggingface: diffusers——现在大部分人都使用这个

1.3 Pipeline

在这里插入图片描述
huggingface hub -> https://huggingface.co/google/ddpm-cat-256(自动下载需要上网)
在这里插入图片描述

二、流水线解构

2.1 扩散模型

在这里插入图片描述
在这里插入图片描述

2.2 Scheduler

在这里插入图片描述

2.3 Model

UNet2DConditionModel
在这里插入图片描述
CA就是交叉注意力

2.4 Stable Diffusion

在这里插入图片描述
在这里插入图片描述

三、训练扩散模型

3.1 训练步骤

  1. 准备数据集 Dataset
    2.定义模型架构 Model
  2. 定义扩散过程 Scheduler
  3. 损失函数 MSE
  4. 训练循环 train loop
  5. 优化器、学习率调度 optimizer/lr
  6. 验证 evaluate
  7. 日志、保存 log/save
  8. 可视化 visualization

四、微调

4.1 IP-Adapter

在这里插入图片描述
在这里插入图片描述

五、作业

一、基于本课内容,使用
diffusers库调用stable diffusion1.5 完成生成任务,探索不同组件的结构和作用。
二、自主选择一个微调方法(LORA,DREAMBOOTH,IPAdapter)在小数据集上进行尝试。

相关文章:

  • Unity学习笔记-Unity了解,安装,简单配置(一)
  • Trae AI驱动开发实战:30分钟从0到1实现Django REST天气服务
  • 论文解读 | AAAI'25 Cobra:多模态扩展的大型语言模型,以实现高效推理
  • 信号与系统研究
  • 纷析云开源版- Springboot-增加操作日志接口
  • python脚本实现接入企微机器人
  • Tomcat理论(Ⅰ)
  • 业务流程中的流程管理
  • 图表控件Aspose.Diagram入门教程:使用 Python 将 VSDX 转换为 PDF
  • 对免认证服务提供apikey验证
  • 1.22作业
  • PHP建立MySQL持久化连接(长连接)及mysql与mysqli扩展的区别
  • 74. 搜索二维矩阵(LeetCode 热题 100)
  • 力扣-回溯-93 复原IP地址
  • go http Client net/http
  • 在Linux上创建一个Docker容器并在其中执行Python脚本
  • 解决Spring Data JPA set值后自动更新到数据库问题
  • SpringBoot教程(十四) SpringBoot之集成Redis
  • Java数据结构---栈
  • Rust编程语言入门教程(八)所有权 Stack vs Heap
  • 广州网络引流公司/电商seo优化
  • 最专业的企业营销型网站建设公司/关键词提取
  • 福州企业网站建站系统/关键词歌词林俊杰
  • 宁波seo网站服务/软文代发代理
  • 在那里做网站/客户管理系统
  • 上传视频网站开发/百度手机快速排名点击软件