当前位置: 首页 > news >正文

【记录】HunyuanVideo 文生视频工作流

HunyuanVideo 文生视频工作流指南

概述

本指南详细介绍如何在ComfyUI中使用腾讯混元HunyuanVideo模型进行文本到视频生成的全流程操作,包含环境配置、模型安装和工作流使用说明。
参考:https://comfyui-wiki.com/zh/install/install-comfyui/install-comfyui-on-linux

环境准备

1. ComfyUI安装与更新

  • 新安装:参考ComfyUI安装教程
  • 更新:确保使用最新版本(需包含EmptyHunyuanLatentVideo节点)

注意:必须更新至最新版本才能支持完整功能

模型配置

2.1 主模型

文件名称大小存放路径
hunyuan_video_t2v_720p_bf16.safetensors25.6GBComfyUI/models/diffusion_models

2.2 文本编码器

文件名称大小存放路径
clip_l.safetensors246MBComfyUI/models/text_encoders
llava_llama3_fp8_scaled.safetensors9.09GBComfyUI/models/text_encoders

2.3 VAE模型

文件名称大小存放路径
hunyuan_video_vae_bf16.safetensors493MBComfyUI/models/vae

目录结构示例

ComfyUI/
└── models/├── diffusion_models/│   └── hunyuan_video_t2v_720p_bf16.safetensors├── text_encoders/│   ├── clip_l.safetensors│   └── llava_llama3_fp8_scaled.safetensors└── vae/└── hunyuan_video_vae_bf16.safetensors

工作流配置

3. 工作流下载

  • 获取地址:HunyuanVideo工作流文件

  • 支持分辨率:

比例540p720p(推荐)
9:16544×960720×1280
16:9960×5441280×720
1:1720×720960×960

核心节点说明

4.1 模型加载

  • UNETLoader

    • 参数:hunyuan_video_t2v_720p_bf16.safetensors
    • 显存优化:可选fp8权重类型
  • DualCLIPLoader

    • 双编码器配置:
      • CLIP 1: clip_l.safetensors
      • CLIP 2: llava_llama3_fp8_scaled.safetensors

4.2 视频生成

  • EmptyHunyuanLatentVideo

    • 关键参数:Width/HeightFrame Count(建议129帧)
  • CLIPTextEncode

    • 提示词规范:
    [主体描述], [动作描述], [场景描述], [风格描述], [质量要求]
    

    示例:

    anime girl with fluffy tail, dancing gracefully, cherry blossom garden, studio ghibli style, 4k ultra HD
    

优化建议

5.1 显存优化

  1. 使用VAEDecodeTiled替代VAEDecode
  2. 调整参数:
    • Tile Size: 256 → 128
    • Overlap: 64 → 32

5.2 质量提升

  • 采样步数:20-30步
  • Guidance Scale:6.0-8.0
  • 推荐分辨率:720p(1280×720)

常见问题

显存不足

  • 解决方案:降低分辨率/使用fp8权重

生成缓慢

  • 优化方向:减少帧数/降低采样步数

🖼️ 画质问题

  • 检查要点:
    1. 提示词详细度
    2. 采样器选择(euler/dpm++_2m)
    3. 去噪强度(建议1.0)
      在这里插入图片描述在这里插入图片描述
      在这里插入图片描述
      在这里插入图片描述
      在这里插入图片描述
http://www.dtcms.com/a/177831.html

相关文章:

  • 用于构建安全AI代理的开源防护系统
  • 辰鳗科技朱越洋:紧扣时代契机,全力投身能源转型战略赛道
  • 射频前端模组芯片(PA)三伍微电子GSR2337 兼容替代SKY85337, RTC7646, KCT8247HE
  • 2025年小程序DDoS与CC攻击防御全指南:构建智能安全生态
  • Linux下的c/c++开发之操作Sqlite3数据库
  • 使用 Vite 创建 Vue 3 项目并手动配置路由的完整步骤
  • 蓝桥杯青少 图形化编程(Scratch)每日一练——校门外的树
  • 基于vueflow可拖拽元素的示例(基于官网示例的单文件示例)
  • 面试实践AND面经热点题目总结
  • 探索 C++23 的 views::cartesian_product
  • 基于机器学习的攻击检测与缓解,以及 SDN 环境中的多控制器布局优化
  • 微程序控制器的详细工作过程
  • 如何在Jmeter中调用C程序?
  • 深入理解Embedding Models(嵌入模型):从原理到实战(上)
  • 2025-05-08 Unity 网络基础9——FTP通信
  • 学习笔记:数据库——事务
  • 克里金模型+多目标优化+多属性决策!Kriging+NSGAII+熵权TOPSIS!
  • 使用Jmeter对AI模型服务进行压力测试
  • Matlab 四分之一车体被动和模糊控制对比
  • MySQL报错解决过程
  • MySQL 8.0 OCP 英文题库解析(一)
  • Python 爬虫之 XPath 元素定位
  • 【Linux】swap交换分区管理
  • 【ArcGIS微课1000例】0146:将多个文件夹下的影像移动到一个目标文件夹(以Landscan数据为例)
  • 一文读懂Python之requests模块(36)
  • 精品,架构师总结,MySQL 5.7 查询入门详解
  • 【Rust】结构体
  • 云原生安全治理体系建设全解:挑战、框架与落地路径
  • python线上学习进度报告
  • Docker封装深度学习模型