当前位置: 首页 > news >正文

BBDM: Image-to-image Translation with Brownian Bridge Diffusion Models 译读笔记

BBDM: Image-to-image Translation with Brownian Bridge Diffusion Models

摘要

图像到图像的转换是计算机视觉和图像处理领域中一个重要且具有挑战性的问题。扩散模型(DM)在高质量图像合成方面展现出巨大的潜力,并在图像到图像转换任务上取得了具有竞争力的性能。然而,现有的大多数扩散模型将图像到图像的转换视为条件生成过程,并且严重受到不同域之间的差异影响。本文提出了一种基于布朗桥扩散模型(Brownian Bridge Diffusion Model, BBDM)的新型图像到图像翻译方法,该方法将翻译过程建模为随机布朗桥过程,通过双向扩散直接学习两个领域之间的映射,而非条件生成过程。据本文所知,这是首次将布朗桥扩散过程应用于图像到图像转换的研究。在多个基准测试上的实验结果表明,所提出的 BBDM 模型在视觉检验和定量指标上均实现了具有竞争力的性能。

1 引言

Image-to-image translation [14_pix2pix] 是指在两个不同图像域之间构建映射的过程。许多计算机视觉和图形学中的问题都可以表述为图像到图像翻译(image-to-image translation)问题,例如风格迁移[3_Patch_based, 9_Image_Style, 13_Style_Transfer, 22_Photo_Style]、语义图像合成[21_Layout_to_image, 24_, 34_, 36_, 37_, 40_]以及草图到照片的合成[2,14,43].

http://www.dtcms.com/a/282946.html

相关文章:

  • 汽车电子功能安全标准ISO26262解析(二)——需求部分
  • 使用JS编写一个购物车界面
  • 51c大模型~合集155
  • 求不重叠区间总和最大值
  • 【Linux】基本指令学习1
  • 【从树的视角理解递归】【递归 = 遍历 || 分解】
  • 薄板样条(TPS, Thin Plate Spline)数学原理推导
  • 从0到1开发网页版五子棋:我的Java实战之旅
  • 【ROS/DDS】FastDDS:C++编写一个发布者和订阅者应用程序(三)
  • OpenCV稠密光流估计的一个类cv::optflow::DenseRLOFOpticalFlow
  • hashMap原理(一)
  • FAISS深度学习指南:构建高效向量检索系统的完整方法论
  • SSH连接复用技术在海外云服务器环境下的稳定性验证与优化方案
  • [时序数据库-iotdb]时序数据库iotdb的安装部署
  • 【C++】迭代器
  • 第五章 管道工程 5.4 管道安全质量控制
  • 【前端】HTML语义标签的作用与实践
  • 想删除表中重复数据,只留下一条,sql怎么写
  • 1688商品API全链路开发实践
  • Reddit Karma是什么?Post Karma和Comment Karma的提升指南
  • 搭建基于Gitee文档笔记自动发布
  • 达梦数据库配置兼容MySQL
  • Vue + Element UI 实现单选框
  • [特殊字符] 第1篇:什么是SQL?数据库是啥?我能吃吗?
  • LeafletJS 进阶:GeoJSON 与动态数据可视化
  • UI测试平台TestComplete:关键字驱动测试技巧
  • 【ArcGISPro】修改conda虚拟安装包路径
  • Mybatis的SQL编写—XML方式
  • 无人机EIS增稳技术要点分析
  • 牛客:HJ26 字符串排序[华为机考][map]