当前位置: 首页 > news >正文

在Windows系统上部署 CosyVoice 2

        本文参考 https://github.com/FunAudioLLM/CosyVoice 的安装方法,但是解决了一些安装、运行过程中的错误:

1、使用以下命令克隆 CosyVoice 代码仓库

git clone --recursive https://github.com/FunAudioLLM/CosyVoice.git
# 如果因网络问题未能成功克隆子模块,请重复运行以下命令,直至成功。
cd CosyVoice
git submodule update --init --recursive

2、安装 Anaconda

        访问Anaconda官网下载最新版,并根据指示安装。

3、使用以下命令创建 Conda 环境

conda create -n cosyvoice -y python=3.10
conda activate cosyvoice
pip install -r requirements.txt -i https://mirrors.aliyun.com/pypi/simple/ --trusted-host=mirrors.aliyun.com

4、下载模型

方法一:进入到 CosyVoice 代码目录,使用 git 命令下载模型:

# git模型下载,请确保已安装git lfs
mkdir -p pretrained_models
git clone https://www.modelscope.cn/iic/CosyVoice2-0.5B.git pretrained_models/CosyVoice2-0.5B

方法二:使用Python代码下载

from modelscope import snapshot_download
snapshot_download('iic/CosyVoice2-0.5B', local_dir='pretrained_models/CosyVoice2-0.5B')

5、启动webui

        执行以下命令:

python webui.py --port 50000 --model_dir pretrained_models/CosyVoice2-0.5B

        如果一切正常,在浏览器中打开 http://127.0.0.1:50000/  可以看到以下界面:

6、可能遇到的问题

6.1、DLL load failed while importing _kaldifst: 动态链接库(DLL)初始化例程失败。

        如出现以下问题:

        将 cosyvoice\cli\frontend.py 代码中的以下代码:

try:import ttsfrduse_ttsfrd = True
except ImportError:print("failed to import ttsfrd, use wetext instead")from wetext import Normalizer as ZhNormalizerfrom wetext import Normalizer as EnNormalizeruse_ttsfrd = False

        拷贝到 的最前面,如下图所示:

6.2、FileNotFoundError: [WinError 2] 系统找不到指定的文件

        如果出现以下错误:

File "...\pydub\utils.py", line 274, in mediainfo_jsonres = Popen(command, stdin=stdin_parameter, stdout=PIPE, stderr=PIPE)
...
FileNotFoundError: [WinError 2] 系统找不到指定的文件。

        如图:

        说明系统缺少 ffmpeg 库,打开 https://www.gyan.dev/ffmpeg/builds/ 下载以下文件:

        将下载文件解压到 D:\ffmpeg, 然后将 D:\ffmpeg\bin 添加到系统环境变量的 Path 变量中,重新启动终端,运行以下命令,查看 ffmpeg 是否安装成功:

ffmpeg -version

        然后在参考前面 【5、启动webui】 重新启动。

http://www.dtcms.com/a/564898.html

相关文章:

  • kafka kraft 模式简介
  • 【Html模板】赛博朋克风格数据分析大屏(已上线-可预览)
  • 怎么查网站备案号济南市章丘区建设局网站
  • 颠覆编码范式:Cursor 2.0五大新特性深度解析与AI编程未来洞察
  • 科技引领,档案管理更高效之智慧档案馆三维立体恒温恒湿消毒净化系统
  • MySQL的SUBSTRING函数详解与应用
  • 微企点建站效果付费合肥网络推广外包
  • 企业级管理平台项目设计、架构、业务全解之平台篇
  • android TAB切换
  • 免费试用网站源码上海网站建设穹拓
  • Linux的df和du
  • 【保姆级教程】Debian 服务器 MariaDB/Mysql 配置 Windows 远程连接全流程
  • JAVA算法练习题day58
  • linux-用户和组权限
  • 基于Vue+Python+Orange Pi Zero3的完整视频监控方案
  • 若依开源项目做导入数据时同步新增字典,页面下拉框与表格未同步更新问题
  • 网站权重多少4赤峰网站建设哪个服务好
  • 珠海seo海网站建设南京做网站建设搭建的公司
  • 仓储物流人力如何管理?实时看板动态展示进度,支持管理者即时调整人力
  • 系统架构设计师备考第62天——嵌入式系统软件架构设计方法
  • LeetCode 刷题【143. 重排链表】
  • 网站建设与管理工资wordpress仪表盘添加内容
  • 常见的分布式系统面试题清单
  • 基于 U-Net 的医学图像分割
  • 【图像处理基石】多频谱图像融合算法入门
  • 室温反应蒸发+200℃退火调控 MoOₓ/NiOₓ薄膜:光伏空穴传输材料性能优化与效率潜力(>25%)分析
  • 微算法科技(NASDAQ MLGO):DPoS驱动区块链治理与DAO机制融合,共筑Web3.0坚实基石
  • 视频直播点播平台EasyDSS:助力现代农业驶入数字科技“快车道”
  • 迈网科技 官方网站网站建设调研问卷
  • vue 实现自定义message 全局提示