当前位置: 首页 > news >正文

Stable Diffusion XL网络结构-超详细原创

强烈推荐先看本人的这篇

Stable Diffusion1.5网络结构-超详细原创-CSDN博客

1 Unet

1.1 详细整体结构

1.2 缩小版整体结构

以生成图像1024x1024为例,与SD1.5的3个CrossAttnDownBlock2D和CrossAttnUpBlock2D相比,SDXL只有2个,但SDXL的CrossAttnDownBlock2D模块有了更多的Transformer模块,且只进行了两次下采样,具体的往下看

1.2.1 DownBlock2D

1.2.1.1 ResBolck2D

和SD1.5不一样的是,多了time_id这个输入,表示origin_size, target_size,以及裁剪坐标,比如图中的time_id=[[1024, 1024, 0, 0, 1024, 1024],[1024, 1024, 0, 0, 1024, 1024]]

有一半是负向提示词,以[1024, 1024, 0, 0, 1024, 1024],为例,两个[1024, 1024]表示origin_size, target_size,[0, 0]是裁剪坐标,这是SDXL在训练的时候用了一些trick,把原始输入图像和目标图像的大小,以及裁剪坐标也作为条件参与训练

Downsample2D通过步长为2的卷积进行下采样

 

1.2.2 CrossAttnDownBlock2D

CrossAttnDownBlock2D_1

CrossAttnDownBlock2D_1表示第一个CrossAttnDownBlock2D,它的Transformer2DModel有两个BasicTransformerBlock,而SD1.5的Transformer2DModel只有一个BasicTransformerBlock

CrossAttnDownBlock2D_2

CrossAttnDownBlock2D_2表示第2个CrossAttnDownBlock2D,它的Transformer2DModel有10个BasicTransformerBlock

 1.2.3 UnetMidBlock2DCrossAttn

其中的Transformer2DModel有10个BasicTransformerBlock

 1.2.4 CrossAttnUpBlock2D

CrossAttnUpBlock2D_2

CrossAttnUpBlock2D_2表示第2个CrossAttnUpBlock2D,它的Transformer2DModel有10个BasicTransformerBlock,UpSample2D和SD1.5结构一致

CrossAttnUpBlock2D_1

CrossAttnUpBlock2D_1表示第21个CrossAttnUpBlock2D,它的Transformer2DModel有2个BasicTransformerBlock

未完待续

2 CLIP

相关文章:

  • 【C++进阶之路】第十篇:C++的类型转换
  • 环境配置|GitHub——如何在github上搭建自己写的网站
  • ClickHouse查看执行计划
  • Caché for UNIX®, Linux及macOS的安装及配置
  • mysql 设置远程登录
  • 力扣-414.第三大的数(两种解法)
  • Linux难学?大神告诉你,Linux到底该怎么自学!
  • golang opt-in transparent telemetry
  • 1.什么是Angular?
  • 【CSS】各百分比透明度 opacity 对应的 16 进制颜色值(例如:#FFFFFF80)
  • 网络爬虫|Selenium——find_element_by_xpath()的几种方法
  • 【Python】给出n个数,找出这n个数的最大值,最小值,和。
  • 矿区安全检查VR模拟仿真培训系统更全面、生动有效
  • 【nlp】2.5(gpu version)人名分类器实战项目(对比RNN、LSTM、GRU模型)工程管理方式
  • 算法笔记-第九章-树的遍历(未完成-待整理)
  • 红队攻防之Goby反杀
  • 计算机网络(持续更新…)
  • 本地开发环境和服务器传输数据的几种方法
  • Flink之KeyedState
  • php字符串处理函数的使用
  • 金砖国家召开经贸联络组司局级特别会议,呼吁共同抵制单边主义和贸易保护主义
  • 牛市早报|中方调整对美加征关税措施,五部门约谈外卖平台企业
  • 体坛联播|C罗儿子完成国家队首秀,德约结束与穆雷合作
  • 北京航空航天大学首个海外创新研究院落户巴西
  • 地下5300米开辟“人造气路”,我国页岩气井垂深纪录再刷新
  • 男子退机票被收票价90%的手续费,律师:虽然合规,但显失公平