一个开源免费的TTS工具2.0
在之前的分享文章中,我们已经分享过了一个开源免费的TTS工具(index tts,用于文本转换语音),最近,这个项目又有了比较大的突破和更新。相比于之前仅仅只能克隆音色,新的版本中还能够加入情绪!这使得文本转换的语音更加生动,更加接近人的说话方式。一起来看看~
新版本的界面元素和之前的基本保持一致。左侧是参考音频区,供我们上传参考的音频。中间是需要转换的文本,我们可以将我们需要的文本输入进去。 右侧是基于参考音频和文本生成的最终音频效果。当音频生成完成之后,可以点击播放来听生成的结果。同时也可以点击下载这段生成后的音频。
那么,情绪应该如何添加进去呢?这里有三种情绪的添加方式:【Same as the voice reference】是默认选项,这里默认声音的情绪和输入的参考音频的情绪一致。【Use emotion reference audio】则是需要你再上传一段音频作为情绪的参考。【Use emotion vectors】则是使用情绪向量来对情绪进行控制,如下图所示。(这里的情绪向量指的是每一种情绪值对应的程度,是一个0~1之间的值),我们可以通过控制这个值来控制生成的音频中的情绪饱和度
尝试了一下,相比于之前的版本,融入了情绪的声音生成更加的生动,不像之前那么生硬了。对于有配音、口播需求的人来说用起来更加舒服了。感觉随着功能的更新,后续会越来越逼近人的真实声音。感兴趣的朋友可以持续关注后续的发展。
github:https://github.com/index-tts/index-tts