本地一键部署IndexTTS2,生成情绪饱满的语音,支持Windows和Mac
IndexTTS2 是由 哔哩哔哩(Bilibili)开发的一款工业级可控高效零样本语音合成系统,于2025年9月8日发布。可将文字快速转换为自然流畅的语音,支持中文和英文场景,适合普通用户日常体验、开发者二次开发等多种需求。
魔当(LM Downloader)是一个大模型应用下载工具 ,目前 魔当 已经支持IndexTTS2的一键下载,同时兼容WIndows和macOS。
魔当下载地址:
https://seemts.com/
IndexTTS 2.0 核心功能升级
- 更智能的多语言支持:在1.x版本中英文双语基础上,版本2可能新增日语、韩语等主流语种合成能力,且无需额外配置,输入对应语言文本即可生成自然语音,比如输入日语句子“こんにちは、今日はいい天気です”,能直接输出标准日语发音的语音,满足多场景跨语言配音需求。
- 实时语音风格切换:支持在同一段文本中灵活切换语音风格,比如从“温柔播报”切换为“活泼解说”,只需在文本中添加简单标记(如“[风格:活泼]”),无需重新上传参考语音,解决1.x版本单段语音风格单一的问题,适合制作有声书、短视频旁白等多样化内容。
- 更精准的情感表达:优化情感建模能力,可识别文本中的情感倾向(如喜悦、悲伤、严肃),并自动匹配对应情感的语音语调。例如输入“今天终于拿到录取通知书了,太开心了!”,系统会合成带有明显喜悦情绪的语音,相比1.x版本更贴近人类真实情感表达。
- 移动端适配优化:针对手机等移动设备,推出轻量化调用接口,普通用户通过手机浏览器访问简化版WebUI,即可快速完成文字输入、参考语音上传和语音生成,且生成速度比1.x版本在移动端提升30%以上,减少等待时间。
- 生僻字与特殊符号兼容增强:进一步扩大中文生僻字(如“龘”“靐”)和特殊领域符号(如数学公式、化学方程式简写)的支持范围,输入包含此类内容的文本(如“化学物质H₂O的沸点是100℃”),能精准合成正确发音,避免1.x版本中部分特殊内容无法识别的问题。
系统要求
- 最低8GB内存,将虚拟内存设置得大一些。
- 预留足够硬盘空间,建议18GB以上。
- macOS 11及以上版本,支持Intel和M系列芯片。
- Windows10/11,可用Intel, AMD GPU,推荐用NVIDIA GPU。
在魔当中找到 IndexTTS2
打开魔当,点击左侧菜单的“本地部署”,可以看到多个可以在本地部署的AI应用,找到IndexTTS2。当然也有旧版1.x的IndexTTS,旧版对硬件要求更低一些。
点击IndexTTS2图标,进入应用介绍页。
点击安装按钮,会打开安装窗口,全自动安装IndexTTS2。如果已经安装过IndexTTS2,也不必担心,这样的操作可以当作是更新IndexTTS2的程序,不会重复下载模型文件。
安装成功后,关闭此窗口。
开始运行 IndexTTS2
在应用的详情页,点击右侧的运行按钮,会打开运行窗口。
在成功启动后,会自动打开您的浏览器。
魔当功能介绍
魔当(LM Downloader)支持各类应用的本地部署,如ComfyUI,FramePack,Ollama,Spark-TTS,F5-TTS等。还支持ComfyUI工作流和模型的便捷下载。
魔当下载地址:
https://seemts.com/