当前位置：首页 > news >正文

Stable diffusion 3 正式开源

news 2025/10/17 15:54:37

6月12日晚，著名开源大模型平台Stability AI正式开源了，文生图片模型Stable Diffusion 3 Medium（以下简称“SD3-M”）权重。

SD3-M有20亿参数，平均生成图片时间在2—10秒左右推理效率非常高，同时对硬件的需求比同类型也低，这是一款适合PC、手机、平板的大模型。

此外，SD3-M还与英伟达、AMD合作，特地针对RTX GPU 、TensorRT和最新CPU、MI-300X进行了优化，性能最高可提升50%。

开源地址：https://huggingface.co/stabilityai/stable-diffusion-3-medium

免费在线试用：https://huggingface.co/spaces/stabilityai/stable-diffusion-3-medium

根据Stability AI的介绍，SD3-M使用的是多模态扩散变换器 (MMDiT)架构，生成的图片质量、排版、复杂文本提示/语义理解和资源效率方面的性能得到了极大提高。

训练数据集方面，SD3-M使用了包含10亿张图片的公开和合成数据进行了预训练，同时针对特定艺术风格和领域，使用了3000万张图片进行了微调以及300万张偏好图片。

所以，SD3-M对用户的文本提示理解和嵌入图片文字的效果将比前两代更好。根据在线demo，为大家展示一下SD3-M的生成效果。

高耸的摩天大楼、飞驰的汽车和充满活力的全息广告构成的未来主义城市景观

日落时宁静的海滩景色，金色的沙滩，温柔的海浪，一对夫妇手牵手散步

郁郁葱葱的热带雨林，茂密的树叶，五颜六色的鸟类，背景是瀑布。

一家20世纪50年代的老式餐厅，配有棋盘地板、红色乙烯基展位和播放经典摇滚乐的自动点唱机。

一个异想天开的幻想世界，漂浮的岛屿，雄伟的龙在天空中飞翔，下面是迷人的森林。

一个时尚现代的厨房，配有不锈钢器具、大理石台面和一扇俯瞰花园的大窗户。

以上只是部分案例，有兴趣的小伙伴可以通过在线demo免费无限生成。目前SD3-M只能用于学术研究无法商业化。如果想商用需要联系Stability AI进行商业授权。

本文素材来源SD3-M官网，如有侵权请联系删除

END

查看全文

http://www.dtcms.com/a/11233.html

嵌入式硬件VS软件，到底哪个更难？

详解 HBase 的安装部署及命令行操作

C语言从头学22——main( )函数

VMR，支持30+种编程语言的SDK版本管理器，支持Windows/MacOS/Linux。

嵌入式开发十八：USART串口通信实验

22种常用设计模式示例代码

Building wheels for collected packages: mmcv, mmcv-full 卡住

Mamaba3--RNN、状态方程、勒让德多项式

Vue CLI，Vue Router，Vuex

如何配置node.js环境

Vue59-全局事件总线：任意组件间通信

软件工程复习

数据库 | 试卷五试卷六试卷七

深圳中小企业融资攻略，贷款方法大盘点！

TIME_WAIT的危害

Flutter 中点击输入框之外的区域，进行失焦，收起键盘

基于SSM的个人博客管理系统

ceph scrub 错误记录

关于python的字节串与字符串的转换

网络学习(15)|有http/1为什么还会有http/2

第九章 Python 异常、模块与包

爆赞！GitHub首本Python开发实战背记手册，标星果然百万名不虚传

vue中的自定义指令

element--el-table添加合计后固定列x轴滚动条无法滚动问题

ubuntu第三方库离线安装包（.deb离线安装方法；apt离线安装；离线安装deb）（docker离线安装、安装docker安装）

人力资源招聘社会校企类型招聘系统校园招聘小程序

全国第四轮软件工程学科评估结果

PHP表单设计：确保必需字段完整性的最佳实践

TDengine数据迁移

ffmpeg封装和解封装介绍-（8）解封装和封装重构

相关文章：