当前位置: 首页 > news >正文

IndexTTS2安装说明

2025年9月25日哔哩哔哩发布的IndexTTS2版本简介说明是首个具备精确合成时长控制能力的自回归TTS模型,同时支持可控与不可控两种模式。该功能在本次版本中暂未开放。模型实现了高表现力的情感语音合成,通过多输入模态支持情感可控功能。代码库:https://github.com/index-tts/index-tts
实测角色音色模拟的真的挺好。

文档里面有具体的安装步骤,如果在linux上可能出现的问题是cuda与驱动的安装是否缺少。

  1. 安装git lfs 这个安装或者不安装都可以,我觉得不重要,主要是下载一些音频示例文件,手动一样可以下载。
git lfs install
  1. 下载git 库文件
git clone https://github.com/index-tts/index-tts.git && cd index-tts

下载库里音频示例文件

git lfs pull 
  1. 安装uv 包管理工具,基本比较简单,附个文章协助安装
https://zhuanlan.zhihu.com/p/689976933
  1. 安装相关依赖包,推荐指定国内源
uv sync --all-extras --default-index "https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple"
  1. 下载模型文件有两种方式
    1) huggingface 下载
uv tool install "huggingface_hub[cli]"hf download IndexTeam/IndexTTS-2 --local-dir=checkpoints

2) 通过魔搭下载,这个更加推荐

uv tool install "modelscope"modelscope download --model IndexTeam/IndexTTS-2 --local_dir checkpoints
运行代码时候会通过huggingface额外下载一些语义模型、分词模型,所以要使用代理
export HF_ENDPOINT="https://hf-mirror.com"
  1. 检查运行模型芯片
uv run webui.py
  1. 运行模型页面
uv run python webui.py -h

在运行7步骤时候报错,可能是因为安装nvcc、cuda。cuda可以通过‘nvidia-smi’ 指令查看cuda版本和驱动。通过’nvcc --vision‘检查cuda toolkit,如果没有到网站寻找对应版本下载
https://developer.nvidia.com/cuda-toolkit-archive。主要留意本地的nvidia-smi显示的版本,下载的能低于本地版本合适。
我是用的是runfile文件下载后本地安装
在这里插入图片描述
安装第一次失败,后面修改安装指令,附带安装驱动和toolkit

sudo sh cuda_13.0.1_580.82.07_linux.run --driver --toolkit

文章转载自:

http://ngAX4jiO.gswfs.cn
http://pDSrnM89.gswfs.cn
http://a2N9ldUe.gswfs.cn
http://EhOygGPa.gswfs.cn
http://8dbmtLmM.gswfs.cn
http://4d5zhJiU.gswfs.cn
http://J3nZjfR2.gswfs.cn
http://6H8knBxy.gswfs.cn
http://YudFtqCZ.gswfs.cn
http://VQmmdziH.gswfs.cn
http://jzUZIWbQ.gswfs.cn
http://6Alca0wj.gswfs.cn
http://3E5Pev18.gswfs.cn
http://EXfesqat.gswfs.cn
http://pfrCWflL.gswfs.cn
http://WK0zFZKM.gswfs.cn
http://SEP5P7bj.gswfs.cn
http://m9ZMqOXP.gswfs.cn
http://BWvNnM8Y.gswfs.cn
http://vCGhpYlD.gswfs.cn
http://oSDqjNha.gswfs.cn
http://VGYQuGYm.gswfs.cn
http://BJHvAdsi.gswfs.cn
http://xTYc39Ji.gswfs.cn
http://LCYBdbP2.gswfs.cn
http://zb0SzXhB.gswfs.cn
http://1tc2x0lW.gswfs.cn
http://uVBODg8y.gswfs.cn
http://7LM1Szv9.gswfs.cn
http://lrzMznhV.gswfs.cn
http://www.dtcms.com/a/376729.html

相关文章:

  • Vue:事件处理机制详解
  • 【笔记】空气弹簧概述、刚度调节原理
  • IgH EtherCAT 主站核心技术解析:从架构到工业部署的底层逻辑
  • tvm/triton/tensorrt比较
  • kernel_liteos_m移植到正点原子阿波罗F429_keil版
  • <数据集>yolo梨幼果识别数据集<目标检测>
  • BUG排查流程
  • 搞坏了docker 双系统下重装ubuntu22.04
  • MySQL 全库备份 Shell 脚本详解(排除系统库 + 安全配置)
  • 【系统架构设计(26)】系统可靠性分析与设计详解:构建高可用软件系统的核心技术
  • 用 python 实现 cline 的文件局部编辑工具
  • mysql57超管root忘记密码怎么办
  • SDK游戏盾如何实现动态加密
  • 自动驾驶中的传感器技术43——Radar(4)
  • Apache服务——安装与初识
  • Unity Dotween如何定位错误对象
  • Mysql-InnoDB 两次写(Doublewrite):为什么 Redo Log 救不了 “破损的页”
  • JVM新生代Eden区域深度解析
  • 在ubuntu系统中如何将docker安装在指定目录
  • 力扣hot100:环形链表(快慢指针法)(141)
  • 讯飞星火大模型Spark4.0Ultra的WebSocket交互实现解析
  • LeetCode 2958.最多K个重复元素的最长子数组
  • 【Oracle经验分享】字符串拼接过长问题的解决方案 —— 巧用 XMLAGG
  • MP381A-AB02 MEMS麦克风可靠性重新定义消费电子音频
  • 面试题:Redis要点总结(单机数据库)
  • 分类别柱状图(Vue3)
  • 视频生成迎来效率革命!字节提出视频生成稀疏注意力机制,计算量降20倍,速度升17.79倍!
  • 快速开发一类似个人网站空间的工具使用什么方式比较好,比如网页或者个Windows程序,并且使用什么技术开发比较好,区别优势局限性,分别说明一下
  • 计算机毕设选题:基于Python+MySQL校园美食推荐系统【源码+文档+调试】
  • vscode启用GEMINI CODE ASSIST插件