当前位置: 首页 > news >正文

fish-speech语音大模型本地部署

文章目录

  • fish-speech模型
    • 下载
    • 编译
    • 部署
  • 小结

fish-speech模型

先说下fish-speech模型吧,可以先看下官网。如下:
fish-speech官网
这就是一个模型,可以根据一个样例声音,构建出自己需要的声音。其实,这个还是有很多用途的;商业的配音太多了,就像喜马拉雅的配音师,也是不少的;再说个我们常见的,像一些短视频平台的配音,也可以用它来生成。这类应用还是蛮多的。应用场景就不多说了,来看下具体怎么部署。

下载

第一步,去git下载。然后编译,我在windows上部署的。可以简单看下,如下:
首先执行如下命令:
install_env.bat
这个会有一些时间。

编译

其次,这个阶段,需要下载一些文件,比如llvm,msvc,visual studio,cuda。当然,这些我是之前都安装过的。所以就省略了。具体,看自己的需要。

部署

最后,执行start.bat。本地会出现训练推理界面;如下:
在这里插入图片描述
如果不需要,可以修改start.bat,如下图所示,
在这里插入图片描述
然后,执行,即可出现生成语音的界面;如下:
在这里插入图片描述
看下整个工程的内容,如下:
在这里插入图片描述

小结

好了,就写到这里了。本篇主要详细的写了怎么本地编译,部署fish-speech;如果第一次,难免中间会出现很多问题,一点一点解决。最终能部署成功的。其实,可以看到,项目中有很多和ffmpeg相关的内容,如果对ffmpeg感兴趣,可以去学习学习。OK,结束。有问题,可以和我沟通,一起聊聊。

相关文章:

  • Leetcode 3306. Count of Substrings Containing Every Vowel and K Consonants II
  • 针对考研的C语言学习(定制化快速掌握重点2)
  • Zabbix 7.0 图表中文乱码问题处理步骤
  • u2net网络模型训练自己数据集
  • 【Linux】包管理器、vim详解及简单配置
  • 9月27日,每日信息差
  • MATLAB案例 | 沪深股市收益率的二元Copula模型
  • sql中的regexp与like区别
  • 三位数排序
  • PDF对话RAG应用开发实战
  • grafana加载缓慢解决方案
  • MySQL数据库备份详解
  • 内存泄漏和内存溢出简述
  • 9、论文阅读:无监督的感知驱动深水下图像增强
  • Modbus协议和PLC协议的区别和联系
  • 丹摩智算平台部署 Llama 3.1:实践与体验
  • R语言Shiny包新手教程
  • 11-pg内核之锁管理器(六)死锁检测
  • 【解决方案】git错误:对象文件为空 error: object file
  • vincent,一个超酷的Python库
  • 经济日报刊文:品牌经营不能让情怀唱“独角戏”
  • “降息潮”延续!存款利率全面迈向“1时代”
  • 屈晓华履新四川省社科联党组书记,此前担任省国动办主任
  • 中俄元首今年首次面对面会谈,达成哪些新的重要共识?
  • 九部门:对机动车特别是货车排放问题的监管将更加严格
  • 明星站台“胖都来”背后:百元起录视频,20万可请顶流