当前位置: 首页 > news >正文

【扩散模型入门】Latent Diffusion

在这里插入图片描述

1. 概述

扩散模型为公众所知的一个主要原因是Stable Diffusion(SD)的推出展现出了远超以往的图像合成效果,而SD的主要技术就是Latent Diffusion Model(LDM)。

实际上,LDM的核心idea非常简单:

  1. 为了确保生成质量,LDM尽可能提升去噪模型的规模。
  2. 提升模型规模往往也会同步导致计算开销的增加,进而导致生成的效率大幅降低。为了克服该负面影响,LDM训练一个自编码器,将图像进行压缩表征,然后在压缩了数据维度的特征空间中进行扩散模型的训练。
  3. 自编码器的encoder部分负责压缩图像的数据维度,而decoder负责将图像恢复出来。
  4. 训练时,自然图像用encoder变换为压缩后的潜变量 z z
http://www.dtcms.com/a/74639.html

相关文章:

  • 问题链的拓扑学重构
  • 【Android】ListView控件在进入|退出小窗下的异常
  • 数据库事务
  • Android Fresco 框架缓存模块源码深度剖析(二)
  • 解决 Android Studio “waiting for all target devices to come online“ 卡住问题
  • Asp.net Core API 本地化
  • ACWing:178. 第K短路 (A*算法)
  • 关于SR的一些基本认识
  • 华为OD机试 - 计算观看演唱会场次(Java 2023 B卷 200分)
  • SpringData Redis:RedisTemplate配置与数据操作
  • Linux中Tomcat、idea和MySQL的安装
  • 基于大模型的声带息肉预测及诊疗方案优化研究报告
  • Qt5.15.2实现Qt for WebAssembly与示例
  • WebAssembly 技术在逆向爬虫中的应用研究
  • Git 实战指南:本地客户端连接 Gitee 全流程
  • 算法基础 -- ARM 体系架构设计专家的算法提升目标
  • OpenCV计算摄影学(21)非真实感渲染之边缘保留滤波器edgePreservingFilter()
  • YOLOv11融合[CVPR2025]ARConv中的自适应矩阵卷积
  • 支持向量机SVM的MATLAB分类预测实现
  • 洛谷 P1115 最大子段和(前缀和详解)c++
  • mysql gtid 创建主从大量冲突解决办法
  • 单台openEuler24.03 LTS下的开源大数据环境搭建
  • ubuntu 24.04(linux)安装 jetbrains IntelliJ IDEA,设置图标
  • JDBC相关
  • 连续出现的字符(信息学奥赛一本通-1148)
  • docker配置国内镜像站链接
  • Three.js Fog 组件知识整理
  • 贪心算法(7)(java) 分发饼干
  • Python的类和对象(3)
  • HTML中滚动加载的实现