当前位置: 首页 > news >正文

WSL部署CosyVoice

#工作记录

好消息!PyCharm 社区版现已支持直接选择 WSL 终端为默认终端-CSDN博客

PyCharm Community社区版链接WSL虚拟环境_pycharm wsl-CSDN博客

在WSL2-Ubuntu中安装CUDA12.8、cuDNN、Anaconda、Pytorch并验证安装_cuda 12.8 pytorch版本-CSDN博客

1、克隆仓库

克隆仓库到Windows本地目录

git clone --recursive https://github.com/FunAudioLLM/CosyVoice.git
# 如果由于网络故障无法克隆子模块,请反复运行以下命令直至成功
cd CosyVoice
git submodule update --init --recursive

2、创建 Conda 环境:

在PyCharm里配置WSL为默认终端,然后创建

conda create -n cosyvoice -y python=3.10
conda activate cosyvoice
# WeTextProcessing 需要 pynini,请使用 conda 安装,因为使用conda可以在所有平台上成功安装。
conda install -y -c conda-forge pynini==2.1.5
pip install -r requirements.txt -i https://mirrors.aliyun.com/pypi/simple/ --trusted-host=mirrors.aliyun.com

如果遇到 sox 兼容性问题:

# 如果遇到 sox 兼容性问题(视情况/可选)
# Ubuntu 系统
sudo apt-get install sox libsox-dev

 

激活环境

安装pynini 

安装 requirements.txt

可以看到整个安装过程非常顺畅,不会出现直接在Windows平台部署的各种问题。

 

下载模型

modelscope download --model iic/CosyVoice2-0.5B --local_dir ./pretrained_models/CosyVoice2-0.5B

 这条命令使用了 modelscope 工具来下载指定的模型,并将其保存到本地目录。

命令解析

  • modelscope download :这是用于从 ModelScope 平台下载模型的命令。

  • --model iic/CosyVoice2-0.5B :指定了要下载的模型名称,这里是 iic/CosyVoice2-0.5B,表示由 IIC 组织或用户提供的 CosyVoice2-0.5B 模型。

  • --local_dir ./pretrained_models/CosyVoice2-0.5B :指定了下载的模型保存到本地的目录路径,这里是当前目录下的 pretrained_models/CosyVoice2-0.5B 文件夹。

命令作用

这条命令的作用是从 ModelScope 下载 CosyVoice2-0.5B 模型,并将其保存到本地的 ./pretrained_models/CosyVoice2-0.5B 目录中,以便在本地项目中使用该预训练模型。

使用前提

在运行这条命令之前,需要确保已经安装了 ModelScope 的 Python 库(在本项目中,已在requirements.txt文件中指定了),并且可以通过 Python 脚本调用 modelscope 命令。

运行程序:

python webui.py --port 50000 --model_dir pretrained_models/CosyVoice2-0.5B

 打开输出中提供的链接:

http://0.0.0.0:50000

 

 测试部署是否成功:

在“跨语种复刻”中上传一段30S内的单人说话音频,然后查看生成情况:

生成成功,下载生成的音频听听看是不是正确:

 

 至此,部署成功,可以进行其他调试了。

 

http://www.dtcms.com/a/178024.html

相关文章:

  • 零基础入门Hadoop:IntelliJ IDEA远程连接服务器中Hadoop运行WordCount
  • Redis协议与异步方式
  • 编写大模型Prompt提示词方法
  • 问题 | 当前计算机视觉迫切解决的问题
  • LangChain框架-PromptTemplate 详解
  • 2025.5.8总结(中期审视)
  • 关于MySQL 数据库故障排查指南
  • uniapp|获取当前用户定位、与系统设定位置计算相隔米数、实现打卡签到(可自定义设定位置、位置有效范围米数)
  • #define ccw (0)和#define ccw 0什么区别
  • javaer快速从idea转战vscode
  • SpringBoot应急知识学习系统开发实现
  • AI CUBE 使用指南 目标检测格式范例 AI cube 报错数据集不合规范,请清洗数据集
  • 简易的考试系统设计(Web实验)
  • 差分OPA verilogaA 模型
  • uniapp自定义步骤条(可二开进行调试)
  • 幂等的几种解决方案以及实践
  • Memgraph 的安装教程
  • node.js 实战——在express 中将input file 美化,并完成裁剪、上传进度条
  • uni-pages-hot-modules插件:uni-app的pages.json的模块化及模块热重载
  • python实现的音乐播放器
  • 【Pandas】pandas DataFrame abs
  • 无实体对话式社交机器人 拟人化印象形成机制:基于多模态交互与文化适配的拓展研究
  • 使用ESPHome烧录固件到ESP32-C3并接入HomeAssistant
  • 使用pytorch保存和加载预训练的模型方法
  • 基于Transformer的多资产收益预测模型实战(附PyTorch实现与避坑指南)
  • OpenHarmony平台驱动开发(九),MIPI DSI
  • 如何使用npm下载指定版本的cli工具
  • 【MySQL】存储引擎 - MyISAM详解
  • FPGA_Verilog实现QSPI驱动,完成FLASH程序固化
  • [ctfshow web入门] web57