当前位置: 首页 > news >正文

网站建设公司初心郑州文明网

网站建设公司初心,郑州文明网,泰安网站建设收费标准,深圳网站建设公司 交通文章目录 一、前言二、主要贡献三、Introduction四、Methodology4.1 Motivation :4.2Framework Overview.** 一、前言 通信作者是香港理工大学 & OPPO研究所的张磊教授,也是图像超分ISR的一个大牛了。 论文如下 SeeSR: Towards Semantics-Aware Rea…

文章目录

  • 一、前言
  • 二、主要贡献
  • 三、Introduction
  • 四、Methodology
    • 4.1 Motivation :
    • 4.2Framework Overview.**

一、前言

通信作者是香港理工大学 & OPPO研究所的张磊教授,也是图像超分ISR的一个大牛了。 论文如下
SeeSR: Towards Semantics-Aware Real-World Image Super-Resolution[paper][code]

二、主要贡献

提出语义感知的方式来保持Real ISR 中的语义保真度。主要包括以下步骤

  • 训练退化感知提示词提取器(degradationaware prompt extractor) 可以在大的退化图像中同时生成软语义提示词和硬语义提示词,提升T2I模型生成充满细节且语义准确的结果。
  • 在推理阶段,将LR 图像的信息融入初始采样噪声,缓解扩散模型产生过多额外细节的趋势。

三、Introduction

   一些常规的介绍。数据方面从单一退化到多种退化,模型方面从GAN发展到了DDPMs。由于大规模预训练的文本到图像模型(T2I)包含大量的文本图像配对数据,包含了丰富的自然图像先验,因此需要作者开始挖掘这种模型的潜力 。StableSR、PASD、DiffBIR就是利用T2I模型作为预训练,进行Real-ISR任务。但是他们存在一定局限性,例如StableSR和DiffBIR 仅依靠LR图像作为控制信号,忽略了语义文本信息在预训练的T2I模型中的作用,PASD模型尝试使用现成的high-level模型提取语义提示词作为额外的控制信息,但是如果LQ图像包含太多物体或者退化太多严重,这个方式就会失效。
这篇工作
  这篇文章深入研究如何提取如何才能更有效的提取提示词来充分利用T2I模型的潜力,并总结了两个关键点:1、提示词应该覆盖尽可能多的对象,帮助模型理解不同的局部区域,2、提示词应该是退化感知的,要避免错误的语义恢复结果。
  基于这两点,作者提出这个方法Semantic-aware SR (SeeSR),这个模型可以使用高质量的语义提示词来增加T2I模型在Real-SR方向上的潜力,这个方法包括两个阶段。1、微调语义提示词提取器,使它获得退化感知能力。2、语义提示词、LR图像共同输入T2I模型进行精细的控制,其中推理阶段还将LR图像的信息嵌入到初始采样噪声中避免生成过多的随机细节。

四、Methodology

4.1 Motivation :

为了释放预训练的 T2I 模型的生成潜力,同时避免 Real-ISR 输出中的语义失真!
作者研究了三种语义提升风格,分别是 classification-style, caption-style ,tag-style.。经过对比,发现他们有如下的特点:
作者认为classification-style 缺少局部物体的信息,caption-style 会出现介词和副词,影响注意力,在存在降质的前提下,有可能语义提示错误导致错误的结果;tag-style 可以提供大量的物体信息,但是有着和caption-style一样的问题,在降质情况下,可能会导致错误的语义信息。
具体的比较可以看图1,不同种类提示词的结果:
在这里插入图片描述
作者认为,可以在tag-style基础上加上降质感知就可以得到较好的结果。
在这里插入图片描述

4.2Framework Overview.**

基于上述讨论,作者确定了整体的任务框架,主要目的是提取高质量的tag-style 提示词用来发挥T2I模型的潜力。下图是整体的任务框架。
在这里插入图片描述
首先是学习退化感知提示词提取器degradation-aware prompt extractor (DAPE),这个提取器包括image encoder 和 tagging head。这个提取器的目的就是让LR提取的提示词和HR提取的提示词尽可能接近。然后输出两个特征,分别是feature representations 以及 tags。这两个东西用来控制T2I模型的生成过程。
第一阶段学习DAPE模块,使用LR、HR的输出作为约束
在这里插入图片描述
第二阶段是将提示词以及LR image 通过交叉注意力模块控制预训练T2I模型。
在这里插入图片描述
最后是细节的处理,在推理阶段,LR的信息嵌入到初始采样噪声中,作者说这样是很有效果的,具体对比图如下
在这里插入图片描述
如果没有LRE模块,那么可能将一些退化增强为细节,如果有这个模块,那么整体生成就更加正常了。

具体实验图见论文

http://www.dtcms.com/a/426187.html

相关文章:

  • 顺通建设集团有限公司 网站网站建设背景文字
  • 昌吉网站建设咨询电话网站 空间 是什么
  • 静态网站flash企业网站用什么系统好
  • 坂田公司做网站php建站系统源码
  • h5网站制作价格排名前十的广告公司
  • 网站建设找推推蛙三文鱼电商代运营
  • 淮南建设工程信息网站是做网站的怀孕后
  • 如何制作虚拟网站网站关键字代码
  • 宁德市住房和城乡建设局网站打不开网站建设总结 优帮云
  • 的广州建网站的公司网站发布与推广计划
  • 宝山专业做网站邢台专业做wap网站
  • 贵州做旅游的网站做一个app需要什么技术
  • 三丰云怎么做网站软件最全的应用商店
  • 提供邵阳网站建设微信公众号推广创意语
  • wordpress motifywordpress 长尾词优化
  • 旅行网站开发背景百度云搜索引擎入口官网
  • 做头像的网站横杆带字杭州房产免费网站建设
  • 广州网站制作公司南通技术网站
  • 网站建设管理维护责任书深圳沙头角网站建设
  • 网站开发实验总结临沂市住房和城乡建设局网站
  • 最流行网站开发工具深圳手机网站建设哪家好
  • 公司备案证查询网站沧州黄骅市贴吧
  • 苏州信网网站建设技术有限公司廊坊建设部网站
  • 网站建设需要有什么特点留学网站建设开发方案
  • 余姚哪里有做淘宝网站的摄影作品欣赏网站
  • 南昌谁做网站设计最好的app制作公司
  • 360网站建设官网网站上传在空间哪里去了
  • 钟山区生态文明建设局网站苏州公司网站建设服务
  • 摄影网站方案苏州网站建设 凡仕臣网络
  • 口碑好门户网站开发杭州市拱墅区建设局网站