当前位置: 首页 > news >正文

大模型——Qwen开源会写中文的生图模型Qwen-Image

Qwen开源会写中文的生图模型Qwen-Image

会写中文,这基本上是开源图片生成模型的独一份了。

这次开源的Qwen-Image 的最大卖点是“像素级文字生成”。它能直接在像素空间内完成排版:从小字注脚到整版海报均可清晰呈现,且同时支持英文字母与汉字。

以下图片均来自官网的生成演示。

388978ba-a564-46c5-ba8b-daf3ac3144f7.png

官方在技术博客中称,它专为复杂文字渲染与精准图像编辑而生,将生成与编辑两条链路纳入统一架构,意在向开发者与设计师提供“一站式视觉创作底座” 。

9b170227-a883-4b06-b29e-95475ece8d99.png

基准显示,在 LongText-Bench、ChineseWord 等评测里,英文渲染可比肩 GPT-4o,中文更是当前开源最佳,不管是人物风景还是字体色彩,整体上都饱和度非常的高,比较的悦目。

http://www.dtcms.com/a/316518.html

相关文章:

  • 【Dify学习笔记】:保留原所有数据,升级Dify版本
  • Linux(16)——进程间通信(下)
  • 深度学习·基础知识
  • BUUCTF杂项MISC题解题思路(3)(不断更新)
  • AG32 mcu通过ahb转apb方式操作cpld外设
  • 计算机视觉CS231n学习(3)
  • 基于深度学习的医学图像分析:使用CycleGAN实现医学图像风格转换
  • 深入理解Spring Boot自动配置原理
  • 区块链:重构信任的价值互联网革命​
  • 技术实践:在Debian上为同型号双网卡配置差异化驱动
  • 【Algorithm | 0x02 动态规划】背包问题
  • AIDL学习
  • sql调优总结
  • MySQL 5.7 和 8.0 离线安装教程(图文版适合电脑小白)
  • 信用机制的发展与货币演进
  • CSRF漏洞原理及利用(全)
  • vue环境的搭建
  • 从汽车到航天发动机:三坐标检测深孔的挑战
  • OpenGL图形渲染管线:从三维世界到二维屏幕的奇妙旅程
  • nflsoi 8.2 题解
  • bluetooth matlab GFSK 调制解调,误码率统计
  • 委托第三方软件检测机构出具验收测试报告需要做哪些准备?
  • helm部署graph-node服务
  • linux nfs+autofs
  • 并发 Vs 并行
  • 管式土壤墒情监测站在高标准农田的作用
  • 具身智能触觉传感器全景调研
  • HTML 如何转 Markdown
  • 【YOLO学习笔记】YOLOv1详解
  • 亚马逊标品与非标品广告运营:从架构搭建到策略优化的专业方法论