当前位置: 首页 > news >正文

fish-speech语音大模型本地部署

文章目录

  • fish-speech模型
    • 下载
    • 编译
    • 部署
  • 小结

fish-speech模型

先说下fish-speech模型吧,可以先看下官网。如下:
fish-speech官网
这就是一个模型,可以根据一个样例声音,构建出自己需要的声音。其实,这个还是有很多用途的;商业的配音太多了,就像喜马拉雅的配音师,也是不少的;再说个我们常见的,像一些短视频平台的配音,也可以用它来生成。这类应用还是蛮多的。应用场景就不多说了,来看下具体怎么部署。

下载

第一步,去git下载。然后编译,我在windows上部署的。可以简单看下,如下:
首先执行如下命令:
install_env.bat
这个会有一些时间。

编译

其次,这个阶段,需要下载一些文件,比如llvm,msvc,visual studio,cuda。当然,这些我是之前都安装过的。所以就省略了。具体,看自己的需要。

部署

最后,执行start.bat。本地会出现训练推理界面;如下:
在这里插入图片描述
如果不需要,可以修改start.bat,如下图所示,
在这里插入图片描述
然后,执行,即可出现生成语音的界面;如下:
在这里插入图片描述
看下整个工程的内容,如下:
在这里插入图片描述

小结

好了,就写到这里了。本篇主要详细的写了怎么本地编译,部署fish-speech;如果第一次,难免中间会出现很多问题,一点一点解决。最终能部署成功的。其实,可以看到,项目中有很多和ffmpeg相关的内容,如果对ffmpeg感兴趣,可以去学习学习。OK,结束。有问题,可以和我沟通,一起聊聊。

http://www.dtcms.com/a/13188.html

相关文章:

  • Leetcode 3306. Count of Substrings Containing Every Vowel and K Consonants II
  • 针对考研的C语言学习(定制化快速掌握重点2)
  • Zabbix 7.0 图表中文乱码问题处理步骤
  • u2net网络模型训练自己数据集
  • 【Linux】包管理器、vim详解及简单配置
  • 9月27日,每日信息差
  • MATLAB案例 | 沪深股市收益率的二元Copula模型
  • sql中的regexp与like区别
  • 三位数排序
  • PDF对话RAG应用开发实战
  • grafana加载缓慢解决方案
  • MySQL数据库备份详解
  • 内存泄漏和内存溢出简述
  • 9、论文阅读:无监督的感知驱动深水下图像增强
  • Modbus协议和PLC协议的区别和联系
  • 丹摩智算平台部署 Llama 3.1:实践与体验
  • R语言Shiny包新手教程
  • 11-pg内核之锁管理器(六)死锁检测
  • 【解决方案】git错误:对象文件为空 error: object file
  • vincent,一个超酷的Python库
  • 详解Linux文件系统
  • 前端大模型入门:使用Transformers.js手搓纯网页版RAG(二)- qwen1.5-0.5B - 纯前端不调接口
  • git 基本原理
  • 软件设计——随手笔记
  • Pencils Protocol 全面推动市场,生态通证 DAPP 将持续通缩
  • 十进制与ip地址转换公式(EXCEL公式)
  • 【系统架构设计师】专题:系统分析和设计
  • Unity 与虚幻引擎对比:两大游戏开发引擎的优劣分析
  • LLM - 使用 XTuner 指令微调 多模态大语言模型(InternVL2) 教程
  • ​IAR全面支持国科环宇AS32X系列RISC-V车规MCU