Mangio RVC Fork 本地部署(Cuda12.9)
在 Windows 11 上尝试部署 Mangio RVC Fork,目标是实现本地语音转换。过程中踩了不少坑,特别是 PyTorch、Fairseq 和依赖安装顺序。这里整理完整流程。
1. 环境准备
-
操作系统:Windows 11
-
Python:3.10(3.11以上有兼容性问题,务必使用3.10)
-
CUDA:12.9
-
GPU:RTX5060 8G
-
开发工具:Vs Code
2. Python 虚拟环境
python -m venv rvc_env
rvc_env\Scripts\activate
pip install --upgrade pip
-
虚拟环境可以避免依赖冲突
-
激活后所有操作都在这个环境下进行
3. PyTorch 安装(CUDA 12.9)
关键点:requirements.txt中的PyTorch是cpu版
pip install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu128
-
说明:
-
--pre 表示 night build
-
对应 CUDA 12.9(cu128)
-
4. Fairseq 安装
-
Windows 报错多,需要C++构建
-
直接手动下载安装 whl 文件:
pip install fairseq-0.12.2-cp310-cp310-win_amd64.whl
-
安全序列化问题,是PyTorch版本问题:
import torch
import fairseq.data.dictionary # 必须先导入
torch.serialization.add_safe_globals([fairseq.data.dictionary.Dictionary])
-
这一步必须加在 infer_web.py ,否则加载 RVC 模型会报错。
5. requirements.txt 安装注意事项
-
不要直接安装整个 requirements.txt,torch 和 fairseq会有问题
-
正确做法:
# 先安装 PyTorch + CUDA 12.8
pip install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu128# 先安装 Fairseq whl
pip install fairseq-0.12.2-cp310-cp310-win_amd64.whl# 再安装 requirements.txt,但删除 torch/fairseq 相关行
pip install -r requirements.txt
6. 模型权重
-
RVC 需要转换的音色模型,放在 weights/ 目录:
weights/
├─ A.pth
├─ B.pth
-
输入音频目录:audios/
-
输出音频目录:opt
-
RMVPE 模型(rmvpe.pt)
-
提取音频特征
-
必须放在项目根路径下,否则 RVC 无法运行
-
-
Hubert Base 模型(hubert_base.pt)
-
音频特征提取的基础模型
-
同样必须放在项目根路径下
-
7. FFmpeg 安装
-
Windows 版 FFmpeg 下载并解压,加入系统 PATH
-
测试命令:
ffmpeg -version
8. Web Infer 启动
-
运行:
python infer_web.py
-
浏览器访问本地端口即可操作
9. 遇到的坑总结
坑 | 解决方案 |
---|---|
CUDA 12.8 + PyTorch | 先安装 night build GPU 版本,再装 requirements.txt |
CPU torch 覆盖 GPU | 删除 requirements.txt 中 torch/fairseq,避免降级 |
Fairseq Windows 安装 | 手动下载 whl 安装 |
安全序列化报错 | infer_web.py 加 add_safe_globals([Dictionary]) |
权重缺失 | rmvpe.pth、hubert_base.pt、RVC 模型都放 weights/ |
FFmpeg | 下载 Windows 版并加入 PATH |