AI Agent开发大全第二十三课-基于本地模型开发文本转语音
背景
今天我们来讲点好玩的也是比较实用的,那就是文本转语音。市面上有不少数字人工具,不过大家注意到没,一般文本转语音都很贵:或以40-60积分换一段语音(15秒)或以5毛钱换30秒语音。这个无论是自用还是企业开发,都是不可接受的,太贵了。因此,今天我们要讲两种方式来实现文本转语音:1. 自建本地模型把文本变成语音;2. 利用企业级的SAAS把文本转语音;并赋上可用于生产环境的Restful API的全代码。要知道很多网上的ChatTTS都是跑不起来或者是只能用CPU跑,还是源于太多人喜欢复制粘贴而没有实际去动手自己去验证,更不要谈在生产环境上的落地了。
本地布署大模型实现文本转语音
我们使用著名的ChatTTS,这个项目搭建稍微有点烦琐,但是它的好处是。。。一旦你搭建完了,可以用廉价GPU(4.5GBGPU显存)就可以得到1万个(对,是10,000个各种不同的口音)这是任何目前企业级SAAS无可比拟的,关键还有一点,一旦搭建好了&#x