WSL部署CosyVoice
#工作记录
好消息!PyCharm 社区版现已支持直接选择 WSL 终端为默认终端-CSDN博客
PyCharm Community社区版链接WSL虚拟环境_pycharm wsl-CSDN博客
在WSL2-Ubuntu中安装CUDA12.8、cuDNN、Anaconda、Pytorch并验证安装_cuda 12.8 pytorch版本-CSDN博客
1、克隆仓库
克隆仓库到Windows本地目录
git clone --recursive https://github.com/FunAudioLLM/CosyVoice.git
# 如果由于网络故障无法克隆子模块,请反复运行以下命令直至成功
cd CosyVoice
git submodule update --init --recursive
2、创建 Conda 环境:
在PyCharm里配置WSL为默认终端,然后创建
conda create -n cosyvoice -y python=3.10
conda activate cosyvoice
# WeTextProcessing 需要 pynini,请使用 conda 安装,因为使用conda可以在所有平台上成功安装。
conda install -y -c conda-forge pynini==2.1.5
pip install -r requirements.txt -i https://mirrors.aliyun.com/pypi/simple/ --trusted-host=mirrors.aliyun.com
如果遇到 sox 兼容性问题:
# 如果遇到 sox 兼容性问题(视情况/可选)
# Ubuntu 系统
sudo apt-get install sox libsox-dev
激活环境
安装pynini
安装 requirements.txt
可以看到整个安装过程非常顺畅,不会出现直接在Windows平台部署的各种问题。
下载模型
modelscope download --model iic/CosyVoice2-0.5B --local_dir ./pretrained_models/CosyVoice2-0.5B
这条命令使用了 modelscope
工具来下载指定的模型,并将其保存到本地目录。
命令解析
-
modelscope download
:这是用于从 ModelScope 平台下载模型的命令。 -
--model iic/CosyVoice2-0.5B
:指定了要下载的模型名称,这里是iic/CosyVoice2-0.5B
,表示由 IIC 组织或用户提供的CosyVoice2-0.5B
模型。 -
--local_dir ./pretrained_models/CosyVoice2-0.5B
:指定了下载的模型保存到本地的目录路径,这里是当前目录下的pretrained_models/CosyVoice2-0.5B
文件夹。
命令作用
这条命令的作用是从 ModelScope 下载 CosyVoice2-0.5B
模型,并将其保存到本地的 ./pretrained_models/CosyVoice2-0.5B
目录中,以便在本地项目中使用该预训练模型。
使用前提
在运行这条命令之前,需要确保已经安装了 ModelScope 的 Python 库(在本项目中,已在requirements.txt文件中指定了),并且可以通过 Python 脚本调用 modelscope
命令。
运行程序:
python webui.py --port 50000 --model_dir pretrained_models/CosyVoice2-0.5B
打开输出中提供的链接:
http://0.0.0.0:50000
测试部署是否成功:
在“跨语种复刻”中上传一段30S内的单人说话音频,然后查看生成情况:
生成成功,下载生成的音频听听看是不是正确:
至此,部署成功,可以进行其他调试了。