当前位置: 首页 > news >正文

TTS:F5-TTS 带有 ConvNeXt V2 的扩散变换器

1,项目简介

F5-TTS 于英文生成领域表现卓越,发音标准程度在本次评测软件中独占鳌头。再者,官方预设的多角色生成模式独具匠心,能够配置多个角色,一次性为多角色、多情绪生成对话式语音,别出心裁。

  • 最低配置:无需显卡,CPU亦可推理生成
  • 据说耗时是所有TTS中最低的
  • 项目地址:https://github.com/SWivid/F5-TTS

2,项目启动

【傻瓜式启动】

conda create -n f5-tts python=3.10
conda activate f5-tts
pip install torch==2.4.0+cu124 torchaudio==2.4.0+cu124 --extra-index-url https://download.pytorch.org/whl/cu124
pip install f5-ttsf5-tts_infer-gradio --port 7860 --host 0.0.0.0

【部署式启动】

  • 服务端:socket_server.py
  • 客户端:socket_client.py

3,功能支持

 E2/F5 TTS 只能功能:

  • F5-TTS(通过流式匹配模仿流利、忠实语音的童话故事机)
  • E2 TTS(令人尴尬的简单完全非自回归零样本 TTS)

相关文章:

  • TXT记录解析技术深度解析与应用实践
  • 阿里巴巴视觉生成大模型1.2.1版本深度部署指南
  • 【原创】基于视觉大模型gemma-3-4b实现短视频自动识别内容并生成解说文案
  • Data whale LLM universe
  • Unable to get end effector tips from jmg
  • Linux zip、unzip 压缩和解压
  • 医疗大模型技术演进与行业应用全景
  • 日语学习-日语知识点小记-构建基础-JLPT-N4阶段(23):受身形
  • c/c++的opencv模糊
  • 【leetcode】2900. 最长相邻不相等子序列 I
  • LVGL- 圆弧形状控件
  • 很啰嗦,再次总结 DOM
  • 历史数据分析——中证白酒
  • 阿里云服务器跑模型教程
  • 数学复习笔记 17
  • 数据结构*优先级队列(堆)
  • 剖析智能指针shared_ptr实现原理
  • 【软考 McCabe度量法】
  • 并发学习之synchronized,JVM内存图,线程基础知识
  • Hi3516DV500刷写固件
  • 《缶翁的世界》首发:看吴昌硕等湖州籍书画家的影响
  • 家国万里·时光故事会|构筑中国船舰钢筋铁骨,她在焊花里展现工匠风范
  • 广西北流出现强降雨,1人被洪水冲走已无生命体征
  • 穆迪下调美国主权信用评级
  • 受贿1.29亿余元,黑龙江省原副省长王一新被判无期
  • 探秘多维魅力,长江经济带、珠三角媒体总编辑岳阳行启动