当前位置: 首页 > wzjs >正文

给医院做网站赚钱吗网站备案 法规

给医院做网站赚钱吗,网站备案 法规,淘宝客做自己的网站,成都创新互联做网站IP-Adapter 的任务与设计原理 背景:IP-Adapter 的任务是什么? IP-Adapter 的核心目标是: 在文本引导合成的扩散模型(如 Stable Diffusion)中,同时引入图像引导信息(比如图像风格、结构、布局…

IP-Adapter 的任务与设计原理

背景:IP-Adapter 的任务是什么?

IP-Adapter 的核心目标是:

在文本引导合成的扩散模型(如 Stable Diffusion)中,同时引入图像引导信息(比如图像风格、结构、布局)来提升多模态控制能力。

但问题来了:

Stable Diffusion 是 text-to-image 预训练的,它的 UNet 中的 attention 机制默认是专门"听文本"的。

❌ 简单拼接图文 embedding 的问题

如果直接把图像和文本的 embedding 拼接在一起当作 cross attention 的 key 和 value:

[ C L S t e x t , . . . , C L S i m a g e , . . . ] → 一起喂给 UNet 进行 cross-attention [CLS_{text}, ..., CLS_{image}, ...] \rightarrow \text{一起喂给 UNet 进行 cross-attention} [CLStext,...,CLSimage,...]一起喂给 UNet 进行 cross-attention

那么就会遇到这些问题:

  1. 模型更偏向文本
    因为模型在预训练时只见过 text condition,它习惯于从文本中提取语义。
    图像 embedding 没受过训练,被当"噪声"忽略或误用。

  2. 细粒度图像控制失败
    图像的结构或风格难以体现,最终图像生成仍然被文本主导。

✅ 解耦 Cross-Attention 的设计动机

Decoupled Cross Attention 的核心做法是:

不混合图像和文本的 embedding,而是分别做两个 Cross Attention,再将输出结果融合。

操作步骤:

  1. 让 UNet latent 分别与图像 embedding 和文本 embedding 做 cross attention:

    z i m g = CrossAttention ( l a t e n t , i m a g e c o n d ) z_{img} = \text{CrossAttention}(latent, image_{cond}) zimg=CrossAttention(latent,imagecond)
    z t x t = CrossAttention ( l a t e n t , t e x t c o n d ) z_{txt} = \text{CrossAttention}(latent, text_{cond}) ztxt=CrossAttention(latent,textcond)

  2. 然后再相加或融合:

    z = z i m g + z t x t z = z_{img} + z_{txt} z=zimg+ztxt

好处:

  • 不争抢注意力资源:图像和文本分别获取表达,不相互干扰。
  • 充分表达图像引导细节:图像信息不会被文本淹没。
  • 保留原始结构:不改变 UNet 的输入接口,只是换了 attention 的处理方式。

总结

IP-Adapter 使用解耦的 cross attention是为了克服 Stable Diffusion 强烈的文本偏向性,避免简单拼接 embedding 导致图像条件被忽视。通过分别建模 latent 对图像和文本的注意力,确保图像条件能提供更细粒度、更有效的控制信号


文章转载自:

http://Dp4sbetg.mtmnk.cn
http://W0gIklE5.mtmnk.cn
http://drJn5uyP.mtmnk.cn
http://px6VMzzc.mtmnk.cn
http://SW8UMAAl.mtmnk.cn
http://eSNDEX7o.mtmnk.cn
http://50V5bHXp.mtmnk.cn
http://UHATnlN4.mtmnk.cn
http://oXCnEtJW.mtmnk.cn
http://s2m5TTzU.mtmnk.cn
http://vmRmxVFk.mtmnk.cn
http://pbwFamYU.mtmnk.cn
http://zj8btCNW.mtmnk.cn
http://lIbMFnRI.mtmnk.cn
http://6TQueYnm.mtmnk.cn
http://rzBDkf8M.mtmnk.cn
http://nDtmcQqN.mtmnk.cn
http://iPYgbUUa.mtmnk.cn
http://Y8ul9wVb.mtmnk.cn
http://VsNstf2T.mtmnk.cn
http://K1QWH3gw.mtmnk.cn
http://MCTbn6W3.mtmnk.cn
http://u4loCeSb.mtmnk.cn
http://YOMvrlAO.mtmnk.cn
http://TO306P9r.mtmnk.cn
http://2qSRu1aI.mtmnk.cn
http://K2d4UrOI.mtmnk.cn
http://laxUh9Lc.mtmnk.cn
http://b2AOG0gK.mtmnk.cn
http://QOExyFyL.mtmnk.cn
http://www.dtcms.com/wzjs/653158.html

相关文章:

  • 网站建设公司织梦模板网站模板演示
  • 会议网站建设恺策网优 营销型网站建设品牌服务商
  • 品牌网站建设最佳大蝌蚪长沙市天心区城乡建设局网站
  • 网站好做吗专业微信网站建设报价
  • 网站开发(定制)合同 模板做网站多钱
  • 安庆做网站的公司网站报价书
  • 上饶网站建设多少钱有哪些微信开发公司
  • 路由器通过域名解析做网站wordpress西班牙语
  • 网站开发开发需求文档网站建设请示文件
  • 温州百度搜索网站排名做网页的心得体会
  • 做极速赛车网站抚州南城网站建设
  • 做logo网站的公司扁平化网站下载
  • 百度网站的优化方案可视化网页开发
  • server2008部署网站广州市广园路建设公司网站
  • 保山 网站建设中国最近重大新闻
  • 网站发布文章怎么才能让百度收录网站遭攻击
  • 推广文案一般多少字seo如何网站正常更新
  • 网站建设风险是什么做推广网站公司
  • 简洁企业网站模板成品网站管系统
  • 石家庄新钥匙网站建设在线制作印章免费
  • 网站建设调查报告建设工程询价网站有哪些
  • 深圳高端网站建设公司西安官网seo价格
  • 网站正在建设中下载广州网站定做
  • ui设计师做网站wordpress怎么上传插件
  • 怎样建设自己的视频网站首页全屋整装120平米的多少钱
  • 团购做的好的网站东莞网站建设58
  • 中国建设银行复核网站网站开发工作分解结构
  • 平板网站开发网站建设能力
  • 人才引进从事网站建设wordpress ios 源码
  • 提升网站速度搜索引擎优化的各种方法