当前位置: 首页 > news >正文

代码讲解系列-CV(六)——视觉生成模型

文章目录

  • 一、Diffusers入门
    • 1.1 扩散模型
    • 1.2 Diffusers——扩散模型工具库
    • 1.3 Pipeline
  • 二、流水线解构
    • 2.1 扩散模型
    • 2.2 Scheduler
    • 2.3 Model
    • 2.4 Stable Diffusion
  • 三、训练扩散模型
    • 3.1 训练步骤
  • 四、微调
    • 4.1 IP-Adapter
  • 五、作业

一、Diffusers入门

1.1 扩散模型

产品:SD, Midjourney, Sora, Luma
在这里插入图片描述

1.2 Diffusers——扩散模型工具库

Guided Diffusion——最早的综合
Stable diffusion——之后
Huggingface: transformers——
Huggingface: diffusers——现在大部分人都使用这个

1.3 Pipeline

在这里插入图片描述
huggingface hub -> https://huggingface.co/google/ddpm-cat-256(自动下载需要上网)
在这里插入图片描述

二、流水线解构

2.1 扩散模型

在这里插入图片描述
在这里插入图片描述

2.2 Scheduler

在这里插入图片描述

2.3 Model

UNet2DConditionModel
在这里插入图片描述
CA就是交叉注意力

2.4 Stable Diffusion

在这里插入图片描述
在这里插入图片描述

三、训练扩散模型

3.1 训练步骤

  1. 准备数据集 Dataset
    2.定义模型架构 Model
  2. 定义扩散过程 Scheduler
  3. 损失函数 MSE
  4. 训练循环 train loop
  5. 优化器、学习率调度 optimizer/lr
  6. 验证 evaluate
  7. 日志、保存 log/save
  8. 可视化 visualization

四、微调

4.1 IP-Adapter

在这里插入图片描述
在这里插入图片描述

五、作业

一、基于本课内容,使用
diffusers库调用stable diffusion1.5 完成生成任务,探索不同组件的结构和作用。
二、自主选择一个微调方法(LORA,DREAMBOOTH,IPAdapter)在小数据集上进行尝试。

http://www.dtcms.com/a/30347.html

相关文章:

  • Unity学习笔记-Unity了解,安装,简单配置(一)
  • Trae AI驱动开发实战:30分钟从0到1实现Django REST天气服务
  • 论文解读 | AAAI'25 Cobra:多模态扩展的大型语言模型,以实现高效推理
  • 信号与系统研究
  • 纷析云开源版- Springboot-增加操作日志接口
  • python脚本实现接入企微机器人
  • Tomcat理论(Ⅰ)
  • 业务流程中的流程管理
  • 图表控件Aspose.Diagram入门教程:使用 Python 将 VSDX 转换为 PDF
  • 对免认证服务提供apikey验证
  • 1.22作业
  • PHP建立MySQL持久化连接(长连接)及mysql与mysqli扩展的区别
  • 74. 搜索二维矩阵(LeetCode 热题 100)
  • 力扣-回溯-93 复原IP地址
  • go http Client net/http
  • 在Linux上创建一个Docker容器并在其中执行Python脚本
  • 解决Spring Data JPA set值后自动更新到数据库问题
  • SpringBoot教程(十四) SpringBoot之集成Redis
  • Java数据结构---栈
  • Rust编程语言入门教程(八)所有权 Stack vs Heap
  • 大白话TypeScript第一章基础入门
  • [Android]浏览器下载的apk文件无法识别无法安装问题
  • 抓包工具 wireshark
  • JavaScript 语言基础之标签语句
  • centos7安装python3.11
  • ASP.NET Core 简单文件上传
  • 科技快讯 | DeepSeek推出NSA加速长上下文训练,xAI Grok系列将陆续开源,月之暗面发布Kimi Latest新模型
  • 基于SpringBoot的智慧家政服务平台系统设计与实现的设计与实现(源码+SQL脚本+LW+部署讲解等)
  • Flowmix/Docx 多模态文档编辑器:新增【操作留痕】功能,让文档编辑有迹可循!...
  • Mac【卸载 Python】 - 3.12.2