当前位置: 首页 > news >正文

大模型——CogView4:生成中英双语高清图片的开源文生图模型综合介绍

CogView4:生成中英双语高清图片的开源文生图模型综合介绍

CogView4 是由清华大学 KEG 实验室(THUDM)开发的一款开源文生图模型,专注于将文本描述转化为高质量图像。它支持中英双语提示词输入,尤其擅长理解中文提示并生成带有汉字的图像,非常适合广告设计、短视频创作等场景。作为首个支持在画面中生成汉字的开源模型,CogView4 在复杂语义对齐和指令跟随能力上表现出色。它基于 GLM-4-9B 文本编码器,支持任意长度的提示词输入,并能生成高达 2048 分辨率的图像。项目托管在 GitHub 上,提供详细代码和使用文档,吸引了大量开发者与创作者关注与参与。

最新的 CogView4 模型将于3月13日上线 智谱清言 官网。

CogView4:生成中英双语高清图片的开源文生图模型-1

在线体验:https://huggingface.co/spaces/THUDM-HF-SPACE/CogView4

功能列表

  • 中英双语提示词生成图像:支持中文和英文描述,能精准理解并生成符合提示的图

相关文章:

  • navicat下载与安装【带布丁】
  • 记录uniapp小程序对接腾讯IM即时通讯无ui集成(2)
  • 人工智能 全部技术栈以及简单运用场景
  • Springboot 循环依赖
  • Python学习第五天
  • 城市管理综合执法系统源码,B/S模式与手机等移动终端架构,java语言开发,可扩展性强
  • 基于 vLLM 部署 LSTM 时序预测模型的“下饭”(智能告警预测与根因分析部署)指南
  • 【学Rust写CAD】10 加法器
  • C++ Primer 动态数组
  • React面试葵花宝典之三
  • Gpt翻译完整版
  • CentOS 7使用RPM安装MySQL
  • 区块链-未来世界的网络形态?
  • 蓝桥杯备考:记忆化搜索之function
  • 通义万相2.1:开启视频生成新时代
  • 若依ruoyi响应json参数
  • LeetCode 21. 合并两个有序链表(Python)
  • 阿里万相,正式开源
  • SLAM文献之-DROID-SLAM: Deep Visual SLAM for Monocular, Stereo, and RGB-D Cameras
  • Android中的ANR(Application Not Responding)现象
  • 设计师必备网站/如何获取永久免费域名
  • 自身网站的平台建设/今日时事新闻
  • 企业网站建设与实施调查报告/广告联盟怎么赚钱
  • 织梦做的网站用什么数据库/网络推广图片大全
  • 深圳做电商平台网站/怎么做业务推广技巧
  • 做网站建设跑业务/个人网站免费域名注册