Ubuntu服务器安装fish-speech本地语音部署教程
Fish Speech 目前最新版本是 V1.5(信息更新至2025年2月)。它是一款功能强大、支持多语言的文本转语音(TTS) 模型,尤其在语音克隆方面表现出色,并提供了便捷的本地部署方案。
下面表格汇总了它的主要特性:
特性维度 | 说明 |
---|---|
核心定位 | 高质量、多语言的生成式语音合成,擅长零样本/少样本语音克隆 |
技术架构 | 采用基于LLM(大语言模型)的生成式方法,整合了VQ-GAN、Llama架构以及DualAR双自回归Transformer设计 |
多语言支持 | 支持13种语言(如中、英、日、韩、法、德、西等),训练数据超100万小时 |
语音克隆 | 零样本 |