当前位置: 首页 > news >正文

Mangio RVC Fork 本地部署(Cuda12.9)

      在 Windows 11 上尝试部署 Mangio RVC Fork,目标是实现本地语音转换。过程中踩了不少坑,特别是 PyTorch、Fairseq 和依赖安装顺序。这里整理完整流程。


1. 环境准备

  • 操作系统:Windows 11

  • Python:3.10(3.11以上有兼容性问题,务必使用3.10)

  • CUDA:12.9

  • GPU:RTX5060 8G

  • 开发工具:Vs Code


2. Python 虚拟环境

python -m venv rvc_env
rvc_env\Scripts\activate
pip install --upgrade pip

  • 虚拟环境可以避免依赖冲突

  • 激活后所有操作都在这个环境下进行


3. PyTorch 安装(CUDA 12.9)

关键点:requirements.txt中的PyTorch是cpu版

pip install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu128

  • 说明:

    • --pre 表示 night build

    • 对应 CUDA 12.9(cu128)


4. Fairseq 安装

  • Windows 报错多,需要C++构建

  • 直接手动下载安装 whl 文件:

pip install fairseq-0.12.2-cp310-cp310-win_amd64.whl

  • 安全序列化问题,是PyTorch版本问题:

import torch
import fairseq.data.dictionary  # 必须先导入
torch.serialization.add_safe_globals([fairseq.data.dictionary.Dictionary])

  • 这一步必须加在 infer_web.py ,否则加载 RVC 模型会报错。


5. requirements.txt 安装注意事项

  • 不要直接安装整个 requirements.txt,torch 和 fairseq会有问题

  • 正确做法:

# 先安装 PyTorch + CUDA 12.8
pip install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu128# 先安装 Fairseq whl
pip install fairseq-0.12.2-cp310-cp310-win_amd64.whl# 再安装 requirements.txt,但删除 torch/fairseq 相关行
pip install -r requirements.txt


6. 模型权重

  • RVC 需要转换的音色模型,放在 weights/ 目录:

weights/
├─ A.pth
├─ B.pth
  • 输入音频目录:audios/

  • 输出音频目录:opt

  • RMVPE 模型(rmvpe.pt)

    • 提取音频特征

    • 必须放在项目根路径下,否则 RVC 无法运行

  • Hubert Base 模型(hubert_base.pt)

    • 音频特征提取的基础模型

    • 同样必须放在项目根路径下


7. FFmpeg 安装

  • Windows 版 FFmpeg 下载并解压,加入系统 PATH

  • 测试命令:

ffmpeg -version


8. Web Infer 启动

  • 运行:

python infer_web.py

  • 浏览器访问本地端口即可操作


9. 遇到的坑总结

解决方案

CUDA 12.8 + PyTorch

先安装 night build GPU 版本,再装 requirements.txt

CPU torch 覆盖 GPU

删除 requirements.txt 中 torch/fairseq,避免降级

Fairseq Windows 安装

手动下载 whl 安装

安全序列化报错

infer_web.py 加 add_safe_globals([Dictionary])

权重缺失

rmvpe.pth、hubert_base.pt、RVC 模型都放 weights/

FFmpeg

下载 Windows 版并加入 PATH

http://www.dtcms.com/a/347301.html

相关文章:

  • 蓝牙aoa仓库管理系统功能介绍
  • 有哪些Spring Boot微服务架构成功落地的案例?
  • GitHub发布革命性工具:GitHub Spark,用自然语言打造全栈智能应用
  • yolo命令行-训练篇(三)
  • Android安卓学习日志1 聊一聊安卓的历史和笔者的想法
  • 微服务统一入口——Gateway
  • 航空复杂壳体零件深孔检测方法 - 激光频率梳 3D 轮廓检测
  • 把 AI 塞进「自行车码表」——基于 MEMS 的 3D 地形预测码表
  • 基础IO
  • electron进程间通信-IPC通信注册机制
  • SAP FI 应收应付账龄分析
  • MySQL 锁的详解:从 InnoDB 到死锁诊断实战
  • Hive Metastore和Hiveserver2启停脚本
  • 爱普生打印机的使用
  • day40-tomcat
  • UE C++ 堆化
  • 【卫星通信】超低码率语音编码ULBC:EnCodec神经音频编解码器架构深度解析
  • 随机森林2——集成学习的发展
  • TCP:传输控制协议
  • JAVA核心基础篇-递归
  • C 语言标准输入输出头文件stdio.h及其常见用法
  • 【读论文】Qwen-Image技术报告解读
  • 云原生高级——K8S总概
  • ArkTS 语言全方位解析:鸿蒙生态开发新选择
  • 双指针:成最多水的容器
  • 使用 eventpp 构建跨 RT-Thread 与 ARM-Linux 的轻量级 Active Object(AO)事件驱动框架
  • AI Agent系列(十三) -智能体架构的真相
  • LoRA 微调
  • 探索 JUC:Java 并发编程的神奇世界
  • 单调栈详解