当前位置：首页 > news >正文

【记录】HunyuanVideo 文生视频工作流

news 2025/10/31 11:54:58

HunyuanVideo 文生视频工作流指南

概述

本指南详细介绍如何在ComfyUI中使用腾讯混元HunyuanVideo模型进行文本到视频生成的全流程操作，包含环境配置、模型安装和工作流使用说明。
参考：https://comfyui-wiki.com/zh/install/install-comfyui/install-comfyui-on-linux

环境准备

1. ComfyUI安装与更新

新安装：参考ComfyUI安装教程
更新：确保使用最新版本（需包含EmptyHunyuanLatentVideo节点）

注意：必须更新至最新版本才能支持完整功能

模型配置

2.1 主模型

文件名称	大小	存放路径
hunyuan_video_t2v_720p_bf16.safetensors	25.6GB	`ComfyUI/models/diffusion_models`

2.2 文本编码器

文件名称	大小	存放路径
clip_l.safetensors	246MB	`ComfyUI/models/text_encoders`
llava_llama3_fp8_scaled.safetensors	9.09GB	`ComfyUI/models/text_encoders`

2.3 VAE模型

文件名称	大小	存放路径
hunyuan_video_vae_bf16.safetensors	493MB	`ComfyUI/models/vae`

目录结构示例

ComfyUI/
└── models/├── diffusion_models/│   └── hunyuan_video_t2v_720p_bf16.safetensors├── text_encoders/│   ├── clip_l.safetensors│   └── llava_llama3_fp8_scaled.safetensors└── vae/└── hunyuan_video_vae_bf16.safetensors

工作流配置

3. 工作流下载

获取地址：HunyuanVideo工作流文件
支持分辨率：

比例	540p	720p(推荐)
9:16	544×960	720×1280
16:9	960×544	1280×720
1:1	720×720	960×960

核心节点说明

4.1 模型加载

UNETLoader：
- 参数：hunyuan_video_t2v_720p_bf16.safetensors
- 显存优化：可选fp8权重类型
DualCLIPLoader：
- 双编码器配置：
  - CLIP 1: clip_l.safetensors
  - CLIP 2: llava_llama3_fp8_scaled.safetensors

4.2 视频生成

EmptyHunyuanLatentVideo：
- 关键参数：Width/Height、Frame Count(建议129帧)

CLIPTextEncode：

提示词规范：

[主体描述], [动作描述], [场景描述], [风格描述], [质量要求]

示例：

anime girl with fluffy tail, dancing gracefully, cherry blossom garden, studio ghibli style, 4k ultra HD

优化建议

5.1 显存优化

使用VAEDecodeTiled替代VAEDecode
调整参数：
- Tile Size: 256 → 128
- Overlap: 64 → 32

5.2 质量提升

采样步数：20-30步
Guidance Scale：6.0-8.0
推荐分辨率：720p(1280×720)

常见问题

❌ 显存不足：

解决方案：降低分辨率/使用fp8权重

⏳ 生成缓慢：

优化方向：减少帧数/降低采样步数

🖼️ 画质问题：

检查要点：
1. 提示词详细度
2. 采样器选择(euler/dpm++_2m)
3. 去噪强度(建议1.0)

查看全文

http://www.dtcms.com/a/177831.html

用于构建安全AI代理的开源防护系统

辰鳗科技朱越洋：紧扣时代契机，全力投身能源转型战略赛道

射频前端模组芯片（PA）三伍微电子GSR2337 兼容替代SKY85337, RTC7646, KCT8247HE

2025年小程序DDoS与CC攻击防御全指南：构建智能安全生态

Linux下的c/c++开发之操作Sqlite3数据库

使用 Vite 创建 Vue 3 项目并手动配置路由的完整步骤

蓝桥杯青少图形化编程（Scratch）每日一练——校门外的树

基于vueflow可拖拽元素的示例(基于官网示例的单文件示例)

面试实践AND面经热点题目总结

探索 C++23 的 views::cartesian_product

基于机器学习的攻击检测与缓解，以及 SDN 环境中的多控制器布局优化

微程序控制器的详细工作过程

如何在Jmeter中调用C程序？

深入理解Embedding Models（嵌入模型）：从原理到实战（上）

2025-05-08 Unity 网络基础9——FTP通信

学习笔记：数据库——事务

克里金模型+多目标优化+多属性决策！Kriging+NSGAII+熵权TOPSIS！

使用Jmeter对AI模型服务进行压力测试

Matlab 四分之一车体被动和模糊控制对比

MySQL报错解决过程

MySQL 8.0 OCP 英文题库解析（一）

Python 爬虫之 XPath 元素定位

【Linux】swap交换分区管理

【ArcGIS微课1000例】0146：将多个文件夹下的影像移动到一个目标文件夹（以Landscan数据为例）

一文读懂Python之requests模块（36）

精品，架构师总结，MySQL 5.7 查询入门详解

【Rust】结构体

云原生安全治理体系建设全解：挑战、框架与落地路径

python线上学习进度报告

Docker封装深度学习模型