当前位置：首页 > news >正文

fish-speech语音大模型本地部署

news 2025/10/14 11:17:33

文章目录

fish-speech模型
- 下载
- 编译
- 部署
小结

fish-speech模型

先说下fish-speech模型吧，可以先看下官网。如下：
fish-speech官网
这就是一个模型，可以根据一个样例声音，构建出自己需要的声音。其实，这个还是有很多用途的；商业的配音太多了，就像喜马拉雅的配音师，也是不少的；再说个我们常见的，像一些短视频平台的配音，也可以用它来生成。这类应用还是蛮多的。应用场景就不多说了，来看下具体怎么部署。

下载

第一步，去git下载。然后编译，我在windows上部署的。可以简单看下，如下：
首先执行如下命令：
install_env.bat
这个会有一些时间。

编译

其次，这个阶段，需要下载一些文件，比如llvm，msvc，visual studio，cuda。当然，这些我是之前都安装过的。所以就省略了。具体，看自己的需要。

部署

最后，执行start.bat。本地会出现训练推理界面；如下：
在这里插入图片描述
如果不需要，可以修改start.bat，如下图所示，

然后，执行，即可出现生成语音的界面；如下：

看下整个工程的内容，如下：

小结

好了，就写到这里了。本篇主要详细的写了怎么本地编译，部署fish-speech；如果第一次，难免中间会出现很多问题，一点一点解决。最终能部署成功的。其实，可以看到，项目中有很多和ffmpeg相关的内容，如果对ffmpeg感兴趣，可以去学习学习。OK，结束。有问题，可以和我沟通，一起聊聊。

http://www.dtcms.com/a/13188.html

相关文章：

Leetcode 3306. Count of Substrings Containing Every Vowel and K Consonants II

针对考研的C语言学习（定制化快速掌握重点2）

Zabbix 7.0 图表中文乱码问题处理步骤

u2net网络模型训练自己数据集

【Linux】包管理器、vim详解及简单配置

9月27日，每日信息差

MATLAB案例 | 沪深股市收益率的二元Copula模型

sql中的regexp与like区别

三位数排序

PDF对话RAG应用开发实战

grafana加载缓慢解决方案

MySQL数据库备份详解

内存泄漏和内存溢出简述

9、论文阅读：无监督的感知驱动深水下图像增强

Modbus协议和PLC协议的区别和联系

丹摩智算平台部署 Llama 3.1：实践与体验

R语言Shiny包新手教程

11-pg内核之锁管理器（六）死锁检测

【解决方案】git错误：对象文件为空 error: object file

vincent，一个超酷的Python库

详解Linux文件系统

前端大模型入门：使用Transformers.js手搓纯网页版RAG（二）- qwen1.5-0.5B - 纯前端不调接口

git 基本原理

软件设计——随手笔记

Pencils Protocol 全面推动市场，生态通证 DAPP 将持续通缩

十进制与ip地址转换公式（EXCEL公式)

【系统架构设计师】专题：系统分析和设计

Unity 与虚幻引擎对比：两大游戏开发引擎的优劣分析

LLM - 使用 XTuner 指令微调多模态大语言模型(InternVL2) 教程

IAR全面支持国科环宇AS32X系列RISC-V车规MCU