当前位置: 首页 > news >正文

【Diffusion Model】发展历程

扩散模型从出现发展到今天已经成为深度学习领域的一个庞大的分支,对于刚刚踏入扩散模型领域的同学,了解扩散模型发展的历程才能在这浩瀚的文献之海中找到到达彼岸的一条航线。
扩散模型(Diffusion Models)是近年来快速发展的生成模型家族,其核心思想是通过逐步添加和去除噪声来学习数据分布。以下是其发展历程及关键论文和模型的梳理:

1. 理论基础与早期探索(2015)

2015年:《Deep Unsupervised Learning using Nonequilibrium Thermodynamics》(ICML 2015)
作者:Jascha Sohl-Dickstein 等
论文链接:https://arxiv.org/abs/1503.03585
贡献:首次将非平衡统计物理中的扩散过程与生成模型结合,提出通过前向过程逐步加噪和反向过程去噪生成数据。
意义:扩散模型的雏形

2. 关键突破:DDPM(2020)

2020年:《Denoising Diffusion Probabilistic Models》(NeurIPS 2020)
作者:Jonathan Ho 等
模型简称: DDPM

论文链接:https://arxiv.org/abs/2006.11239
贡献:将扩散过程形式化为马尔可夫链,使用U-Net预测噪声。 引入重参数化技巧和简化损失函数,大幅提升训练稳定性。
意义:奠定了现代扩散模型的基础框架。

3. 加速采样与改进

2021年:《Improved Denoising Diffusion Probabilistic Models》(ICML 2021)
模型简称: IDDPM
作者:OpenAI团队
论文链接:https://arxiv.org/abs/2102.09672
代码仓库:https://github.com/openai/improved-diffusion 注:这个代码很重要哦!!!!
贡献: 引入可学习的方差和混合损失,提升生成质量。 提出分类器引导(Classifier Guidance),利用类别信息控制生成。

2021年:《Diffusion Models Beat GANs on Image Synthesis》(NeurIPS 2021)
模型简称:Guided Diffusion
作者:OpenAI团队
贡献:通过更大规模的U-Net架构和自适应归一化(Adaptive Group Normalization),首次在图像生成质量上超越GANs(如BigGAN)。 提出无分类器引导(Classifier-Free Guidance),避免依赖额外分类器。

2021年:《Denoising Diffusion Implicit Models》(ICLR 2021)
模型简称: DDIM
作者:Jiaming Song, Chenlin Meng, Stefano Ermon
贡献:提出了一种加速采样方法,采样50-100步就可以得到近似于1000步的效果。

4. 基于分数的扩散模型(SDE框架)

2019年:《Generative Modeling by Estimating Gradients of the Data Distribution》(NeurIPS 2019)
作者:Yang Song 等
贡献:提出基于分数的生成模型(Score-Based Models),通过估计数据分布的梯度生成样本。

2021年:《Score-Based Generative Modeling through Stochastic Differential Equations》(ICLR 2021)
作者:Yang Song 等
贡献: 将扩散模型与基于分数的方法统一为随机微分方程(SDE)框架。 提出预测器校正器采样(PC Sampler)加速生成。

5. 文本到图像生成

2022年:《Hierarchical Text-Conditional Image Generation with CLIP Latents》(OpenAI, 2022)
模型:DALLE2
贡献:结合CLIP的文本嵌入与扩散模型,实现高质量文本到图像生成。

2022年:《High-Resolution Image Synthesis with Latent Diffusion Models》(CVPR 2022)
作者:Stability AI团队
模型:Stable Diffusion
贡献: 在潜空间(Latent Space)进行扩散,大幅降低计算成本。 引入交叉注意力机制实现多模态(文本/图像)条件生成。

2023年:《SDXL: Improving Latent Diffusion Models for High-Resolution Image Synthesis》
模型:Stable Diffusion XL(SDXL)
改进:更大规模模型,支持更高分辨率生成。

在整个发展历程中最重要的三篇文章: DDPMIDDPMDDIM ,这三篇大家搞懂了之后,其余的文章看起来也就没有什么压力了。

http://www.dtcms.com/a/525711.html

相关文章:

  • 作用域 变量提升(Hoisting)的代码输出题
  • 商城网站建设最好的公司免费网站打包app
  • 网站没有关键词自己做的网站如何上首页
  • 【Matlab】异常处理:MException
  • 郑州友网站建设四川省建设监理协会网站
  • 本地部署Docsify生成文档网站并实现公网环境远程访问
  • 有做a50期货的网站服务周到的微网站建设
  • Linux:开源时代的隐形基石
  • 毕业设计做企业门户网站搭建网页的基础语言
  • 破解本地生活 “到店-复购“ 断层!我店+微团双模式,核销率提升90%
  • 仿qq商城版淘宝客网站源码模板+带程序后台文章dede织梦企业程序网站做担保交易平台
  • Rust中的智能指针
  • 网站建设论文提纲论坛门户网站开发
  • 有哪些单页网站网站建设代码走查
  • 四线城市做网站建设怎么样网页设计与制作全过程
  • Telegram tdlib客户端Java本地编译打包
  • 上海做网站的公司是什么桂林象鼻山景区介绍
  • 阿里云渠道商:OSS与传统存储系统的差异在哪里?
  • Redis事务和Lua脚本对比
  • 广州微信网站建设报价表宝塔建站系统
  • Git 日常
  • 2. C语言 多级指针
  • 素材下载网站模板深圳企业网络推广运营技巧
  • 前沿技术借鉴研讨-2025.10.21(数据缺失填补/提取信号/分类)
  • StarRocks笔记
  • 便捷商铺源码聊天交友定制程序开发源码二开
  • STM32的四种延时方法
  • 手机网站怎么制作织梦网站备份几种方法
  • 网站设计答辩ppt大宗贸易平台
  • 【大模型与OCR】配合应用的示例demo