当前位置: 首页 > news >正文

docker安装index-tts,实现文本转语音的本地私有化部署

一、背景

ai编程场景里,文本转语音,可以使用第三方的云服务,需要收费。(天下没有免费的午餐)
如果你想要自己做一些实验,而又不想付费,可以自己部署一套系统。
推荐index-tts,原因是它有成熟的docker部署方案,其次它支持模仿真人的音色。
很好地适用于听书等音频制作,不过想要免费部署,要求的配置高,特别是内存。

二、docker部署

docker run -d --name index-tts \--platform linux/amd64 \-p 7860:7860 \-v ~/index-tts-data:/app/data \--shm-size=2g \luojiecong/index-tts:1.5-20250727-9098497

第一次,因为内存不足,运行出错。

2025-11-14 08:52:58,434 WETEXT INFO building fst for zh_normalizer ...
/tmp/tmpi7r4wi67: line 3: 35 Killed python webui.py --model_dir /checkpoints --host 0.0.0.0 --port 7860
ERROR conda.cli.main_run:execute(127): `conda run python webui.py --model_dir /checkpoints --host 0.0.0.0 --port 7860` failed. (See above for error)

我本机是采用docker desktop桌面版,机器是mac book pro m3,内存仅18G。

这里调大些资源配置,主要是内存,我这里指定申请6G内存。

docker run -d --name index-tts \--platform linux/amd64 \-p 7860:7860 \-v ~/index-tts-data:/app/data \--memory=12g --memory-swap=12g \--shm-size=2g \luojiecong/index-tts:1.5-20250727-9098497

再次运行。
在这里插入图片描述

2025-11-14 08:55:43,287 WETEXT INFO building fst for zh_normalizer ...2025-11-14 08:56:22,640 WETEXT INFO done2025-11-14 08:56:22,641 WETEXT INFO fst path: /workspace/index-tts/indextts/utils/tagger_cache/zh_tn_tagger.fst2025-11-14 08:56:22,641 WETEXT INFO /workspace/index-tts/indextts/utils/tagger_cache/zh_tn_verbalizer.fst2025-11-14 08:56:22,662 WETEXT INFO found existing fst: /opt/conda/envs/indextts/lib/python3.10/site-packages/tn/en_tn_tagger.fst2025-11-14 08:56:22,662 WETEXT INFO /opt/conda/envs/indextts/lib/python3.10/site-packages/tn/en_tn_verbalizer.fst2025-11-14 08:56:22,662 WETEXT INFO skip building fst for en_normalizer ...

这次终于运行正常。

配置低,在文本转语音的时候,有个明显吃亏的地方是,转换时长久。

访问UI:http://localhost:7860/

在这里插入图片描述

参考音频,就是你自己上传或者录制的声音。

生成的音频就会根据前者,对文本进行转换至语音。

三、API编程

见UI底部,你可以详细查看其API接口。这里就不往后延伸。

在这里插入图片描述
http://localhost:7860/?view=api
在这里插入图片描述
你也可以通过mcp对接index-tts。

在这里插入图片描述

四、总结

在选择index-tts前,我还动手部署了一把spark-tts,当然还是采用docker部署。

发现要打开文本转语音的UI界面,难于登天,尝试了好几个镜像,无论是lite版本还是full版本,都无济于事。

因为不想让你去踩坑,就不细描述当时是如何部署spark-tts了。

没有UI界面,打开了其swagger文档http://localhost:7860/docs
在这里插入图片描述

spark-tts的镜像地址:https://hub.docker.com/r/breakstring/spark-tts

下载并安装:

docker run -d --name spark-tts \--platform linux/amd64 \-p 7860:7860 \-v ~/spark-tts-data:/app/data \--shm-size=2g \breakstring/spark-tts:latest-lite
http://www.dtcms.com/a/614467.html

相关文章:

  • 【 Java八股文面试 | Redis篇 缓存问题、持久化、分布式锁 】
  • 乐清网站建设推广公司网站模板设计
  • 招商银行和建设银行网站功能对比app页面设计图片
  • 存储引擎MySQL
  • XML Schema any 元素详解
  • 沈阳网站推广运营公司微信公众号网页
  • MyBatis 的 新增、修改、删除 操作
  • 2025年计算机行情如何,有哪些方向可以入坑
  • C语言编译器优化技术研究
  • 鸿蒙PC平台三方库移植实战:以libid3tag库为例(附完整移植流程)
  • 国际企业网站建设请人做网站需要注意什么
  • 网站建设平台设备知名互联网公司有哪些
  • 使用62256为8051单片机扩展SRAM(使用proteus仿真)
  • LeetCode 刷题【155. 最小栈】
  • 零售场景下的数智店商:解决盗损问题,化解隐性成本痛点
  • 做网站 计算机有交嘛一个thinkphp搭建的微网站
  • 郑州炫彩网站建设企业网站的建设与实现
  • 网站建设外文文献湖南省建设厅证件查询
  • 综合练习-02
  • 《Multimodal Machine Learning: A Survey and Taxonomy》论文主要内容
  • 设计师网站有哪些郑州抖音seo推广
  • 爪哇周赛 Round 1
  • 如何做双版网站查询网138网站域名
  • 常州建设工程监理员挂证网站上网站建设
  • [C++]拷贝构造函数使用规则以及注意事项
  • 针对RK3506J 开发嵌入式固件架构选型:RT-Thread SMP 与 Linux 部署方案对比
  • 襄阳教育云平台网站建设长沙seo优化推广
  • 10.2 MCP三驾马车:Prompts、Resources、Tools详解
  • Hilbert空间中随机变量的一点几何直觉
  • 网站制作费用贵不贵wordpress 视频