coqui-ai/TTS 安装
apt update
apt install -y python3-venv python3-dev build-essential libespeak-ng1 libsndfile1 ffmpeg
mkdir -p /usr/local/develop/tts-coqui
cd /usr/local/develop/tts-coqui
#在目录下建py环境
python3 -m venv .venv
#激活环境
source .venv/bin/activate
pip install -U pip wheel
# Coqui TTS 要求 Python >=3.9 且 <3.12;你的环境满足就行
pip install "TTS"
它具体装到哪?
包文件:
/usr/local/develop/tts-coqui/.venv/lib/python3.11/site-packages/
命令行工具(可执行文件):
/usr/local/develop/tts-coqui/.venv/bin/
(里面会有tts
)你当前看到的一大串第三方库(torch、spacy 等)都装进了这个
.venv
里,不会影响系统全局 Python。
验证
# 列出可用模型(很多)
tts --list_models
默认可能是GPU 我这边是CPU 要卸载一些东西
(.venv) root@v2202508296509376829:/usr/local/develop/tts-coqui# pip list | grep nvidia
nvidia-cublas-cu12 12.8.4.1
nvidia-cuda-cupti-cu12 12.8.90
nvidia-cuda-nvrtc-cu12 12.8.93
nvidia-cuda-runtime-cu12 12.8.90
nvidia-cudnn-cu12 9.10.2.21
nvidia-cufft-cu12 11.3.3.83
nvidia-cufile-cu12 1.13.1.3
nvidia-curand-cu12 10.3.9.90
nvidia-cusolver-cu12 11.7.3.90
nvidia-cusparse-cu12 12.5.8.93
nvidia-cusparselt-cu12 0.7.1
nvidia-nccl-cu12 2.27.3
nvidia-nvjitlink-cu12 12.8.93
nvidia-nvtx-cu12 12.8.90
pip uninstall -y $(pip list | awk '{print $1}' | grep -E '^nvidia-')
或者只卸载
pip uninstall -y torch torchaudio
pip install --index-url https://download.pytorch.org/whl/cpu \
torch==2.5.1 torchaudio==2.5.1
# 直接合成(单模型也行)
tts --text "你好,欢迎使用智能语音合成服务。" \
--model_name "tts_models/zh-CN/baker/tacotron2-DDC" \
--out_path hello.wav
就是python选择了一个模型跑起来
nohup python3 -m TTS.server.server \
--model_name "tts_models/zh-CN/baker/tacotron2-DDC-GST" \
--vocoder_name "vocoder_models/en/ljspeech/univnet" \
--port 5010 > tts.log 2>&1 &
测试 表单提交
curl -X POST "http://127.0.0.1:5010/api/tts" \
-F "text=你好,欢迎使用智能语音合成服务。" \
--output out.wav
deactivate
这样会回到系统默认的 Python 环境,不影响后台的 nohup 进程。
ps -ef | grep TTS.server