当前位置：首页 > news >正文

大模型——CogView4：生成中英双语高清图片的开源文生图模型综合介绍

news 2025/10/8 13:29:11

CogView4：生成中英双语高清图片的开源文生图模型综合介绍

CogView4 是由清华大学 KEG 实验室（THUDM）开发的一款开源文生图模型，专注于将文本描述转化为高质量图像。它支持中英双语提示词输入，尤其擅长理解中文提示并生成带有汉字的图像，非常适合广告设计、短视频创作等场景。作为首个支持在画面中生成汉字的开源模型，CogView4 在复杂语义对齐和指令跟随能力上表现出色。它基于 GLM-4-9B 文本编码器，支持任意长度的提示词输入，并能生成高达 2048 分辨率的图像。项目托管在 GitHub 上，提供详细代码和使用文档，吸引了大量开发者与创作者关注与参与。

最新的 CogView4 模型将于3月13日上线智谱清言官网。

CogView4：生成中英双语高清图片的开源文生图模型-1

在线体验：https://huggingface.co/spaces/THUDM-HF-SPACE/CogView4

功能列表

中英双语提示词生成图像：支持中文和英文描述，能精准理解并生成符合提示的图

http://www.dtcms.com/a/50593.html

相关文章：

navicat下载与安装【带布丁】

记录uniapp小程序对接腾讯IM即时通讯无ui集成（2）

人工智能全部技术栈以及简单运用场景

Springboot 循环依赖

Python学习第五天

城市管理综合执法系统源码，B/S模式与手机等移动终端架构，java语言开发，可扩展性强

基于 vLLM 部署 LSTM 时序预测模型的“下饭”（智能告警预测与根因分析部署）指南

【学Rust写CAD】10 加法器

C++ Primer 动态数组

React面试葵花宝典之三

Gpt翻译完整版

CentOS 7使用RPM安装MySQL

区块链-未来世界的网络形态？

蓝桥杯备考：记忆化搜索之function

通义万相2.1：开启视频生成新时代

若依ruoyi响应json参数

LeetCode 21. 合并两个有序链表(Python)

阿里万相，正式开源

SLAM文献之-DROID-SLAM: Deep Visual SLAM for Monocular, Stereo, and RGB-D Cameras

Android中的ANR（Application Not Responding）现象

计算机网络进化史：从烽火台到元宇宙的信息高速公路

Android中的AtomicLong：原理、使用与实战指南

SpringBoot 整合 Vault - 解决敏感配置信息的动态加密与权限管控问题

一些有用的电子书

四十二：VSCODE打开新文件覆盖上一个文件窗口问题

特征工程如何让KNN准确率提升20%？标准化、筛选与编码全解析

动规【力扣】72. 编辑距离

【Python运维】用Python自动化AWS资源管理：利用boto3实现高效管理S3桶和EC2实例

MySQL-简介与基本命令

LeetCode 热题 100----1.两数之和