当前位置: 首页 > news >正文

mac部署GPT-SoVITS,生成粤语踩坑点及使用记录

自己录音,普通话或者粤语

注意:

与在其他设备上训练的模型相比,在mac上使用gpu训练的模型的质量明显较低,因此我们暂时使用cpu代替。

  1. Install Xcode command-line tools by running xcode-select --install.
  2. Install FFmpeg by running brew install ffmpeg.
  3. Install the program by running the following commands:
conda create -n GPTSoVits python=3.9
conda activate GPTSoVits
pip install -r requirements.txt

GitHub - RVC-Boss/GPT-SoVITS: 1 min voice data can also be used to train a good TTS model! (few shot voice cloning)

注意py的版本

激活环境:

conda activate GPTSoVits 

在macos上训练自己的声音

激活环境:

conda activate GPTSoVits 

第一踩坑点

启动命令:

python3 webui.py

之后,无法跳转,显示超时

File "/opt/anaconda3/envs/GPTSoVits/lib/python3.9/site-packages/pydantic/_internal/_generate_schema.py", line 558, in _unknown_type_schema
    raise PydanticSchemaGenerationError(
pydantic.errors.PydanticSchemaGenerationError

解决方法:

pip uninstall fastapi
pip install fastapi==0.112.2

成功跑起:

第二个踩坑点

是在微调训练gpt报错

RuntimeError: Index tensor must have the same number of dimensions as self tensor
return torch.zeros_like(preds_oh, dtype=torch.int32).scatter_(-1, result.unsqueeze(1).unsqueeze(1), 1)
RuntimeError: Index tensor must have the same number of dimensions as self tensor
​

解决方法:

pip install torchmetrics==1.5

最后成功跑起

效果:

CondaError: Run 'conda init' before 'conda activate'

利用Mobaxterm连接远程服务器,在创建conda环境后报错。

输入conda init后返回No action taken.

解决方法

  1. 输入source activate,后发现前面多了(base)

  2. 输入conda activate xxx(此处为自定义的环境名称),后发现(base)变为(xxx)

参考:https://zhuanlan.zhihu.com/p/683118485

使用教程记录

 语音切割,降噪,进行选择语音,就可以打标了

 打标界面

 之后可以进行训练了

 微调模型

 

终端 

http://www.dtcms.com/a/63277.html

相关文章:

  • Spring框架中的单例Bean是线程安全的吗
  • 《Android应用性能优化全解析:常见问题与解决方案》
  • 自动化领域零部件企业研究
  • windows上传uniapp打包的ipa文件到app store构建版本
  • OpenManus-通过源码方式本地运行OpenManus,含踩坑及处理方案,chrome.exe位置修改
  • 小肥柴慢慢手写数据结构(C篇)(4-3 关于栈和队列的讨论)
  • CentOS 8 更换软件源
  • Ubuntu 22.04 无法进入图形界面的解决方法
  • 浅谈大语言模型(LLM)的微调与部署
  • centos 安装 php gmp 模块
  • YashanDB认证,YCA证书认证教程,免费证书,内含真题考试题库及答案——五分钟速成
  • 设备物联网无线通信,ESP32-C3芯片模组方案,智能化联动控制
  • 003-SpringCloud Alibaba-Nacos(配置中心)
  • python读取word文档 | AI应用开发
  • 22. 备忘录模式
  • 爬虫中一些有用的用法
  • 【ISP】对于ISP的关键算法补充
  • Python第十七课:卷积神经网络 | 计算机视觉之眼
  • Vue3接入谷歌邮箱登录功能
  • 打造智能钉钉机器人:借助智谱GLM-4-Flash实现高效智能回复(文末附源码)
  • 决策树,Laplace 剪枝与感知机
  • K8S学习之基础二十三:k8s的持久化存储之nfs
  • 【CXX】6 内置绑定
  • MongoDB 触发器实现教程
  • js和java中方法重载(js本身是不支持方法重载,方便对比学习)
  • 从零开始的python学习(五)P75+P76+P77+P78+P79+P80
  • 2001-2023年上市公司数字化转型年报词频统计(年报词频统计和MDA词频统计两种方式)(吴非、赵宸宇、甄红线300+关键词三种方法)
  • 施磊老师c++笔记(四)
  • sonarqube+SonarScanner+postpresql+jenkins
  • 全网最详解答OSPF基础