当前位置: 首页 > news >正文

Stable diffusion 3 正式开源

6月12日晚,著名开源大模型平台Stability AI正式开源了,文生图片模型Stable Diffusion 3 Medium(以下简称“SD3-M”)权重。

 SD3-M有20亿参数,平均生成图片时间在2—10秒左右推理效率非常高,同时对硬件的需求比同类型也低,这是一款适合PC、手机、平板的大模型。

此外,SD3-M还与英伟达、AMD合作,特地针对RTX GPU 、TensorRT和最新CPU、MI-300X进行了优化,性能最高可提升50%。

开源地址:https://huggingface.co/stabilityai/stable-diffusion-3-medium

免费在线试用:https://huggingface.co/spaces/stabilityai/stable-diffusion-3-medium

根据Stability AI的介绍,SD3-M使用的是多模态扩散变换器 (MMDiT)架构,生成的图片质量、排版、复杂文本提示/语义理解和资源效率方面的性能得到了极大提高。

训练数据集方面,SD3-M使用了包含10亿张图片的公开和合成数据进行了预训练,同时针对特定艺术风格和领域,使用了3000万张图片进行了微调以及300万张偏好图片。

所以,SD3-M对用户的文本提示理解和嵌入图片文字的效果将比前两代更好。根据在线demo,为大家展示一下SD3-M的生成效果。

高耸的摩天大楼、飞驰的汽车和充满活力的全息广告构成的未来主义城市景观

图片

日落时宁静的海滩景色,金色的沙滩,温柔的海浪,一对夫妇手牵手散步

图片

郁郁葱葱的热带雨林,茂密的树叶,五颜六色的鸟类,背景是瀑布。

图片

一家20世纪50年代的老式餐厅,配有棋盘地板、红色乙烯基展位和播放经典摇滚乐的自动点唱机。

图片

一个异想天开的幻想世界,漂浮的岛屿,雄伟的龙在天空中飞翔,下面是迷人的森林。

图片

一个时尚现代的厨房,配有不锈钢器具、大理石台面和一扇俯瞰花园的大窗户。

图片

以上只是部分案例,有兴趣的小伙伴可以通过在线demo免费无限生成。目前SD3-M只能用于学术研究无法商业化。如果想商用需要联系Stability AI进行商业授权。

本文素材来源SD3-M官网,如有侵权请联系删除

END

图片

图片

相关文章:

  • 嵌入式硬件VS软件,到底哪个更难?
  • 详解 HBase 的安装部署及命令行操作
  • C语言从头学22——main( )函数
  • VMR,支持30+种编程语言的SDK版本管理器,支持Windows/MacOS/Linux。
  • 嵌入式开发十八:USART串口通信实验
  • 22种常用设计模式示例代码
  • Building wheels for collected packages: mmcv, mmcv-full 卡住
  • Mamaba3--RNN、状态方程、勒让德多项式
  • Vue CLI,Vue Router,Vuex
  • 如何配置node.js环境
  • Vue59-全局事件总线:任意组件间通信
  • 软件工程复习
  • 数据库 | 试卷五试卷六试卷七
  • 深圳中小企业融资攻略,贷款方法大盘点!
  • TIME_WAIT的危害
  • Flutter 中点击输入框之外的区域,进行失焦,收起键盘
  • 基于SSM的个人博客管理系统
  • ceph scrub 错误记录
  • 关于python的字节串与字符串的转换
  • 网络学习(15)|有http/1为什么还会有http/2
  • 纽约大学朗格尼医学中心的转型带来哪些启示?
  • 习近平抵达莫斯科伏努科沃专机机场发表书面讲话(全文)
  • 重庆动物园大熊猫被游客扔玻璃瓶,相同地方曾被扔可乐瓶
  • 沙发上躺赢又如何?告别冠军绝缘体的凯恩,要开始收割荣誉了
  • 李学明谈笔墨返乡:既耕春圃,念兹乡土
  • 库里22分赢下抢七大战,火箭十年难破“火勇大战”的魔咒