当前位置：首页 > news >正文

IndexTTS2安装说明

news 2025/9/11 6:58:40

2025年9月25日哔哩哔哩发布的IndexTTS2版本简介说明是首个具备精确合成时长控制能力的自回归TTS模型，同时支持可控与不可控两种模式。该功能在本次版本中暂未开放。模型实现了高表现力的情感语音合成，通过多输入模态支持情感可控功能。代码库：https://github.com/index-tts/index-tts
实测角色音色模拟的真的挺好。

文档里面有具体的安装步骤，如果在linux上可能出现的问题是cuda与驱动的安装是否缺少。

安装git lfs 这个安装或者不安装都可以，我觉得不重要，主要是下载一些音频示例文件，手动一样可以下载。

git lfs install

下载git 库文件

git clone https://github.com/index-tts/index-tts.git && cd index-tts

下载库里音频示例文件

git lfs pull

安装uv 包管理工具，基本比较简单，附个文章协助安装

https://zhuanlan.zhihu.com/p/689976933

安装相关依赖包，推荐指定国内源

uv sync --all-extras --default-index "https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple"

下载模型文件有两种方式
1） huggingface 下载

uv tool install "huggingface_hub[cli]"hf download IndexTeam/IndexTTS-2 --local-dir=checkpoints

2）通过魔搭下载，这个更加推荐

uv tool install "modelscope"modelscope download --model IndexTeam/IndexTTS-2 --local_dir checkpoints

运行代码时候会通过huggingface额外下载一些语义模型、分词模型，所以要使用代理

export HF_ENDPOINT="https://hf-mirror.com"

检查运行模型芯片

uv run webui.py

运行模型页面

uv run python webui.py -h

在运行7步骤时候报错，可能是因为安装nvcc、cuda。cuda可以通过‘nvidia-smi’ 指令查看cuda版本和驱动。通过’nvcc --vision‘检查cuda toolkit，如果没有到网站寻找对应版本下载
https://developer.nvidia.com/cuda-toolkit-archive。主要留意本地的nvidia-smi显示的版本，下载的能低于本地版本合适。
我是用的是runfile文件下载后本地安装
在这里插入图片描述
安装第一次失败，后面修改安装指令，附带安装驱动和toolkit

sudo sh cuda_13.0.1_580.82.07_linux.run --driver --toolkit

文章转载自：

http://ngAX4jiO.gswfs.cn
http://pDSrnM89.gswfs.cn
http://a2N9ldUe.gswfs.cn
http://EhOygGPa.gswfs.cn
http://8dbmtLmM.gswfs.cn
http://4d5zhJiU.gswfs.cn
http://J3nZjfR2.gswfs.cn
http://6H8knBxy.gswfs.cn
http://YudFtqCZ.gswfs.cn
http://VQmmdziH.gswfs.cn
http://jzUZIWbQ.gswfs.cn
http://6Alca0wj.gswfs.cn
http://3E5Pev18.gswfs.cn
http://EXfesqat.gswfs.cn
http://pfrCWflL.gswfs.cn
http://WK0zFZKM.gswfs.cn
http://SEP5P7bj.gswfs.cn
http://m9ZMqOXP.gswfs.cn
http://BWvNnM8Y.gswfs.cn
http://vCGhpYlD.gswfs.cn
http://oSDqjNha.gswfs.cn
http://VGYQuGYm.gswfs.cn
http://BJHvAdsi.gswfs.cn
http://xTYc39Ji.gswfs.cn
http://LCYBdbP2.gswfs.cn
http://zb0SzXhB.gswfs.cn
http://1tc2x0lW.gswfs.cn
http://uVBODg8y.gswfs.cn
http://7LM1Szv9.gswfs.cn
http://lrzMznhV.gswfs.cn

查看全文

http://www.dtcms.com/a/376729.html

Vue:事件处理机制详解

【笔记】空气弹簧概述、刚度调节原理

IgH EtherCAT 主站核心技术解析：从架构到工业部署的底层逻辑

tvm/triton/tensorrt比较

kernel_liteos_m移植到正点原子阿波罗F429_keil版

＜数据集＞yolo梨幼果识别数据集＜目标检测＞

BUG排查流程

搞坏了docker 双系统下重装ubuntu22.04

MySQL 全库备份 Shell 脚本详解（排除系统库 + 安全配置）

【系统架构设计（26）】系统可靠性分析与设计详解：构建高可用软件系统的核心技术

用 python 实现 cline 的文件局部编辑工具

mysql57超管root忘记密码怎么办

SDK游戏盾如何实现动态加密

自动驾驶中的传感器技术43——Radar（4）

Apache服务——安装与初识

Unity Dotween如何定位错误对象

Mysql-InnoDB 两次写（Doublewrite）：为什么 Redo Log 救不了 “破损的页”

JVM新生代Eden区域深度解析

在ubuntu系统中如何将docker安装在指定目录

力扣hot100:环形链表（快慢指针法）（141）

讯飞星火大模型Spark4.0Ultra的WebSocket交互实现解析

LeetCode 2958.最多K个重复元素的最长子数组

【Oracle经验分享】字符串拼接过长问题的解决方案 —— 巧用 XMLAGG

MP381A-AB02 MEMS麦克风可靠性重新定义消费电子音频

面试题：Redis要点总结（单机数据库）

分类别柱状图（Vue3）

视频生成迎来效率革命！字节提出视频生成稀疏注意力机制，计算量降20倍，速度升17.79倍!

快速开发一类似个人网站空间的工具使用什么方式比较好，比如网页或者个Windows程序，并且使用什么技术开发比较好，区别优势局限性，分别说明一下

计算机毕设选题：基于Python+MySQL校园美食推荐系统【源码+文档+调试】

vscode启用GEMINI CODE ASSIST插件

相关文章：