当前位置: 首页 > news >正文

【记录】HunyuanVideo 文生视频工作流

HunyuanVideo 文生视频工作流指南

概述

本指南详细介绍如何在ComfyUI中使用腾讯混元HunyuanVideo模型进行文本到视频生成的全流程操作,包含环境配置、模型安装和工作流使用说明。
参考:https://comfyui-wiki.com/zh/install/install-comfyui/install-comfyui-on-linux

环境准备

1. ComfyUI安装与更新

  • 新安装:参考ComfyUI安装教程
  • 更新:确保使用最新版本(需包含EmptyHunyuanLatentVideo节点)

注意:必须更新至最新版本才能支持完整功能

模型配置

2.1 主模型

文件名称大小存放路径
hunyuan_video_t2v_720p_bf16.safetensors25.6GBComfyUI/models/diffusion_models

2.2 文本编码器

文件名称大小存放路径
clip_l.safetensors246MBComfyUI/models/text_encoders
llava_llama3_fp8_scaled.safetensors9.09GBComfyUI/models/text_encoders

2.3 VAE模型

文件名称大小存放路径
hunyuan_video_vae_bf16.safetensors493MBComfyUI/models/vae

目录结构示例

ComfyUI/
└── models/├── diffusion_models/│   └── hunyuan_video_t2v_720p_bf16.safetensors├── text_encoders/│   ├── clip_l.safetensors│   └── llava_llama3_fp8_scaled.safetensors└── vae/└── hunyuan_video_vae_bf16.safetensors

工作流配置

3. 工作流下载

  • 获取地址:HunyuanVideo工作流文件

  • 支持分辨率:

比例540p720p(推荐)
9:16544×960720×1280
16:9960×5441280×720
1:1720×720960×960

核心节点说明

4.1 模型加载

  • UNETLoader

    • 参数:hunyuan_video_t2v_720p_bf16.safetensors
    • 显存优化:可选fp8权重类型
  • DualCLIPLoader

    • 双编码器配置:
      • CLIP 1: clip_l.safetensors
      • CLIP 2: llava_llama3_fp8_scaled.safetensors

4.2 视频生成

  • EmptyHunyuanLatentVideo

    • 关键参数:Width/HeightFrame Count(建议129帧)
  • CLIPTextEncode

    • 提示词规范:
    [主体描述], [动作描述], [场景描述], [风格描述], [质量要求]
    

    示例:

    anime girl with fluffy tail, dancing gracefully, cherry blossom garden, studio ghibli style, 4k ultra HD
    

优化建议

5.1 显存优化

  1. 使用VAEDecodeTiled替代VAEDecode
  2. 调整参数:
    • Tile Size: 256 → 128
    • Overlap: 64 → 32

5.2 质量提升

  • 采样步数:20-30步
  • Guidance Scale:6.0-8.0
  • 推荐分辨率:720p(1280×720)

常见问题

显存不足

  • 解决方案:降低分辨率/使用fp8权重

生成缓慢

  • 优化方向:减少帧数/降低采样步数

🖼️ 画质问题

  • 检查要点:
    1. 提示词详细度
    2. 采样器选择(euler/dpm++_2m)
    3. 去噪强度(建议1.0)
      在这里插入图片描述在这里插入图片描述
      在这里插入图片描述
      在这里插入图片描述
      在这里插入图片描述

相关文章:

  • 用于构建安全AI代理的开源防护系统
  • 辰鳗科技朱越洋:紧扣时代契机,全力投身能源转型战略赛道
  • 射频前端模组芯片(PA)三伍微电子GSR2337 兼容替代SKY85337, RTC7646, KCT8247HE
  • 2025年小程序DDoS与CC攻击防御全指南:构建智能安全生态
  • Linux下的c/c++开发之操作Sqlite3数据库
  • 使用 Vite 创建 Vue 3 项目并手动配置路由的完整步骤
  • 蓝桥杯青少 图形化编程(Scratch)每日一练——校门外的树
  • 基于vueflow可拖拽元素的示例(基于官网示例的单文件示例)
  • 面试实践AND面经热点题目总结
  • 探索 C++23 的 views::cartesian_product
  • 基于机器学习的攻击检测与缓解,以及 SDN 环境中的多控制器布局优化
  • 微程序控制器的详细工作过程
  • 如何在Jmeter中调用C程序?
  • 深入理解Embedding Models(嵌入模型):从原理到实战(上)
  • 2025-05-08 Unity 网络基础9——FTP通信
  • 学习笔记:数据库——事务
  • 克里金模型+多目标优化+多属性决策!Kriging+NSGAII+熵权TOPSIS!
  • 使用Jmeter对AI模型服务进行压力测试
  • Matlab 四分之一车体被动和模糊控制对比
  • MySQL报错解决过程
  • 保证断电、碰撞等事故中车门系统能够开启!汽车车门把手将迎来强制性国家标准
  • 保证断电、碰撞等事故中车门系统能够开启!隐藏式门把手将迎来强制性国家标准
  • 广州下调个人住房公积金贷款利率
  • 王耀庆化身“罗朱”说书人,一人挑战15个角色
  • 习近平在俄罗斯媒体发表署名文章
  • 央行:增加支农支小再贷款额度3000亿元