当前位置: 首页 > news >正文

MacOS M芯片 运行GPT-SoVITSv2Pro

之前写过MacOS 下运行GPT-SoVITS2

训练和推理的基本流程类似,目前GPT-Sovits已经升级,MacOS下部署更能简单一些。具体步骤如下:

1、升级brew

brew update-reset 

2、安装ffmpeg(webui.py需要使用)

brew install ffmpeg

3、安装wget(install.sh需要使用)

brew install wget

4、下载代码

git clone 源代码

使用VS Code切换到20250606v2pro tag分支

5、创建虚拟环境 python=3.10,并安装(--device MPS)

conda create -n GPTSoVits python=3.10

conda activate GPTSoVits

bash install.sh --device MPS --source ModelScope --download-uvr5

6、启动WebUI

python webui.py

7、操作简要说明(和原来基本一致):

1)UVR5界面不必须的,主要用于分离歌声与背景声音

2)指定待训练的声音文件路径:如:input/someone

3)依次执行声音拆分、降噪和ASR转写(自动标注)

4)标注界面也不是必须的(手工标注)

5)一键三连提取自监督特征和语义特征(第一步需要下载nltk_data,有可能会失败,要科学上网)

6)依次训练sovits和gpt模型

7)部署模型

8)推理
 

http://www.dtcms.com/a/373015.html

相关文章:

  • 域名网页加载慢怎么解决:从测速到优化的全链路性能优化实战
  • Http协议+请求响应+分层解耦
  • MySQL高级特性详解
  • 【Claude Code】 保姆级教程
  • 【Pywinauto库】0. Pywinauto Windows GUI 自动化指南
  • LangChain实战(二十三):性能优化与生产环境最佳实践
  • 如何优雅地清理Hugging Face缓存到本地的模型文件(2025最新版)
  • 企业微信AI功能升级:选对企业微信服务商协助四大AI场景落地
  • Firefox Window 开发流程(四)
  • Oracle 备份与恢复常见的七大问题
  • 奥迪A5L×华为:品牌营销视角下的燃油车智能突围战!
  • LAMPSecurity: CTF5靶场渗透
  • 【Java实战㉟】Spring Boot与MyBatis:数据库交互的进阶之旅
  • 金融量化指标--3Beta 贝塔
  • leetcode10(跳跃游戏 II)
  • <数据集>无人机航拍人员搜救识别数据集<目标检测>
  • [每周一更]-(第159期):Go 工程师视角:容器化技术(Docker/Kubernetes)与CI/CD流程的应用场景
  • 低代码拖拽实现与bpmn-js详解
  • 六、Docker 核心技术:Dockerfile 指令详解
  • scp 网间拷贝
  • 20250908_开启10.1.3.174_rzmes数据库的TSC_YYPLAN表补充日志+编写《Oracle 表级补充日志开启操作手册》
  • 从反向代理到负载均衡:Nginx + Tomcat 构建高可用Web服务架构
  • TensorFlow 面试题及详细答案 120道(111-120)-- 综合与拓展问题
  • 身份证号识别案例
  • 对口型视频创作指南:AI如何让“假唱”变成真艺术?
  • [免费]基于Python的协同过滤电影推荐系统(Django+Vue+sqlite+爬虫)【论文+源码+SQL脚本】
  • Spark RDD转DataFrame的三种方式
  • Gradio全解10——Streaming:流式传输的音频应用(7)——ElevenLabs:高级智能语音技术
  • 通义万相wan2.2 Fun系列--Camera镜头控制与lnp首尾帧视频模型
  • AI Coding — 基于RAG的Token窗口优化方案