当前位置: 首页 > wzjs >正文

许昌住房和城乡建设局网站天猫网站什么时候建设

许昌住房和城乡建设局网站,天猫网站什么时候建设,济源做网站的好公司,中国贸易网站使用 GPT-SoVITS 克隆声音,很详细 一、前言二、下载三、启动四、克隆声音1、准备克隆音频2、分离人声伴奏3、音频分割4、语音降噪5、ASR工具6、语音文本校对标注工具7、训练模型8、微调训练9、推理 一、前言 最近对文本转语言很感兴趣,但对直接在网站上…

使用 GPT-SoVITS 克隆声音,很详细

  • 一、前言
  • 二、下载
  • 三、启动
  • 四、克隆声音
    • 1、准备克隆音频
    • 2、分离人声伴奏
    • 3、音频分割
    • 4、语音降噪
    • 5、ASR工具
    • 6、语音文本校对标注工具
    • 7、训练模型
    • 8、微调训练
    • 9、推理

一、前言

最近对文本转语言很感兴趣,但对直接在网站上生成的音频音色却不是很满意,经过一番寻找,发现了“GPT-SoVITS” ,对想要的声音进行克隆。

二、下载

可以到这里下载

在这里插入图片描述

下载后解压即可

这里将其解压到如下目录:

E:\software\gpt-sovits

在这里插入图片描述

三、启动

进入“安装目录\GPT-SoVITS-v2-240821\GPT-SoVITS-v2-240821”

双击“go-webui.bat”即可
在这里插入图片描述

会出现一个黑窗口

在这里插入图片描述

启动成功会打开浏览器跳转到这个页面

在这里插入图片描述

四、克隆声音

1、准备克隆音频

先准备好想要提起的声音,这里以克隆芭芭拉的声音为例

在这里插入图片描述

可以到这里下载原音频

下载后将其放到某个文件夹中,这里放到

F:\file\GptSovitsFile\sucai\芭芭拉

2、分离人声伴奏

回到“GPT-SoVITS”中,点击开启“UVR5-WebUI”

在这里插入图片描述

稍等一会儿后会跳转到新的页面

在这里插入图片描述

选择模型,一般选择“HP2_all_vocals”即可,也可以阅读上方解释,选择适合自己的模型

模型介绍:

HP2_all vocals:人声伴奏分离模型,提取音频中所有人声部分和背景音部分。HP5_only_main_vocal:提取音频中的主唱人声,排除和声和伴唱,适合处理歌曲。model_bs_roformer_ep_317_sdr_12.9755:去掉混音中的干扰成分,增强信噪比。onnx_dereverb_By_FoxJoy:去混响模型,减少音频中由于环境回声或混响造成的声音模糊。VR-DeEchoAggressive:去回声模型,针对严重的回声进行处理,偏向“激进处理”。VR-DeEchoDeReverb:结合去回声和去混响的双重功能,处理音频中的回声和混响问题。VR-DeEchoNormal:去回声模型,适用于一般程度的回声处理,偏向“温和处理”。

在这里插入图片描述

接着输入存放待分离音频路径,前面已经提到将其放到

F:\file\GptSovitsFile\sucai\芭芭拉

在这里插入图片描述

指定输出主人声文件夹和指定输出非主人声文件夹保持默认即可

在这里插入图片描述

分类之后会保存在“安装目录\GPT-SoVITS-v2-240821\GPT-SoVITS-v2-240821\output\uvr5_opt”

在这里插入图片描述

再选择导出文件格式,这里选择 wav

在这里插入图片描述

最后点击转换

在这里插入图片描述

看到成功的信息表示转换完成

在这里插入图片描述

再查看输出目录 uvr5_opt

在这里插入图片描述

两条音频都试听一下,找出人声音频,因为要克隆声音,伴奏音频没用,这里将其删除了

在这里插入图片描述

这时就可以回到主界面,关闭“UVR5-WebUI”

在这里插入图片描述

3、音频分割

这里主要针对长音频,如果音频本来就不长,就不需要分割了

回到这界面,已知上面分离的音频保存在“安装目录\GPT-SoVITS-v2-240821\GPT-SoVITS-v2-240821\output\uvr5_opt”路径

这里路径为:

E:\software\gpt-sovits\GPT-SoVITS-v2-240821\GPT-SoVITS-v2-240821\output\uvr5_opt

将文件夹路径放到切分输入路径

在这里插入图片描述

点击开启语言切割

在这里插入图片描述

看到输出信息显示“切割结束”表示切割完成

在这里插入图片描述

4、语音降噪

主要是处理有杂音的音频,如果音频干净可不降噪,直接点击“开启语言降噪即可”

在这里插入图片描述

看到降噪输出信息提示降噪完成即可

在这里插入图片描述

完成后可在“output”下生成“denoise_opt”文件夹

在这里插入图片描述

里面就是降噪的音频

在这里插入图片描述

原来的音频就干净,降噪后对比原音频只是小声了点

5、ASR工具

这一步主要是生成带时间戳的文本,如果需要的是中文,默认即可。

点击“开启离线批量ASR”

在这里插入图片描述

看到输出提示完成即可

在这里插入图片描述

生成文件在“asr_opt”文件夹

在这里插入图片描述

在这里插入图片描述

文件内容如下

在这里插入图片描述

6、语音文本校对标注工具

这一步主要是校对文本 ASR 工具生成的文本是否正确,对错误的文本进行修改。

保持默认,点击“开启打标WebUI”即可

在这里插入图片描述

会跳转到一个新的页面

在这里插入图片描述

因为音频比较短,这里只有一段文本如果音频较长,这里是有多段文本的

检查文本框中的文本是否正确,不正确则进行修改,为了防止出错,建议修改一段点一下“Submit Text”

在这里插入图片描述

这里原文本为:

你喜欢麻辣小鱼干吗?我这还有两条,那给你一条。

将其改为:

你喜欢麻辣小鱼干吗?我这还有两条,呐~给你一条。

确认无误之后回到主界面,点击“关闭打标WebUI”

在这里插入图片描述

7、训练模型

承接上面,将主界面拉到最顶部,选择“1-GPT-SoVITS-TTS”

在这里插入图片描述

为你的模型取一个名字,这里取名“bbl”

在这里插入图片描述

其他不用修改,拉到最下面,点击“开启一键三连”

在这里插入图片描述

看到结束的提示即可

在这里插入图片描述

这一步是把你的声音样本转换成项目训练模型支持的特定格式,会在日志文件夹“logs”下生成以前面模型命名的文件夹(bbl)

在这里插入图片描述

里面文件如下

在这里插入图片描述

8、微调训练

承接上面的主界面,网上拉到命名模型那一部分,点击“1B-微调训练”

在这里插入图片描述

参数默认即可,先“开启SoVITS”

在这里插入图片描述

等待训练完成

在这里插入图片描述

因为本次使用的是“v2”版本的“GPT-SoVITS”,生成的模型保存在“安装目录\GPT-SoVITS-v2-240821\GPT-SoVITS-v2-240821\SoVITS_weights_v2”

在这里插入图片描述

模型如下

在这里插入图片描述

为什么是两个模型?(总训练轮数)/(保存频率)

接着点击“开启GPT训练”

在这里插入图片描述

等待训练完成

在这里插入图片描述

因为本次使用的是“v2”版本的“GPT-SoVITS”,生成的模型保存在“安装目录\GPT-SoVITS-v2-240821\GPT-SoVITS-v2-240821\GPT_weights_v2”

在这里插入图片描述

模型如下

在这里插入图片描述

同样,三个模型是因为(总训练轮数)/(保存频率)

9、推理

承接上面的主页面,将其往上拉到命名模型下方,点击“1C-推理”

在这里插入图片描述

选择GPT、SoVITS模型,如果没有看到就点击一下“刷新模型路径”

在这里插入图片描述

选择参数最大的模型,效果最好

在这里插入图片描述

在这里插入图片描述

勾选“启用并推理版本”,再点击“开启TTS推理WebUI”

在这里插入图片描述

会跳转到一个新页面

在这里插入图片描述

这是模型区,如果在主界面忘记选,可以在这里选,一般选择参数最大的,效果最好

在这里插入图片描述

这是推理区,可以将前面处理好的音频拖入,比如前面降噪后的音频

在这里插入图片描述

再加上音频台词,就是对应音频的台词

你喜欢麻辣小鱼干吗?我这还有两条,呐~给你一条。

最后在右边添加需要生成音频的文本,这里是:

从来生死都看淡

在这里插入图片描述

推理设置保持默认即可,点击“合成语音”就会生成对应音频

在这里插入图片描述

最后是文本切分区,如果文本很长,可以先放到左边,点击切分,切分方式保持默认,再将右边切分好的文本放到文本生成音频区域

在这里插入图片描述


文章转载自:

http://o0RfdaT3.rwLnk.cn
http://em4ceSud.rwLnk.cn
http://SpcKE7h4.rwLnk.cn
http://XltNnHoW.rwLnk.cn
http://QVtv0dGh.rwLnk.cn
http://d0QYMnaK.rwLnk.cn
http://lR4cmfb3.rwLnk.cn
http://IbQbXfDn.rwLnk.cn
http://XjYcpNO7.rwLnk.cn
http://ehJNgKOF.rwLnk.cn
http://S1PWRJ14.rwLnk.cn
http://TaP1ppuN.rwLnk.cn
http://2Nrni1DU.rwLnk.cn
http://IauUbmAn.rwLnk.cn
http://FWHZVfib.rwLnk.cn
http://zDPPa3PQ.rwLnk.cn
http://99IuGDzn.rwLnk.cn
http://55I1N9lL.rwLnk.cn
http://e9bpXVAw.rwLnk.cn
http://F5l45i89.rwLnk.cn
http://rpCaHTNj.rwLnk.cn
http://AjKCarW5.rwLnk.cn
http://7gaQoZfw.rwLnk.cn
http://rNORYmZ9.rwLnk.cn
http://b7oFD9uk.rwLnk.cn
http://FXsfgoRV.rwLnk.cn
http://JzH8sQ0r.rwLnk.cn
http://HvjpDWnw.rwLnk.cn
http://oXP2pA5y.rwLnk.cn
http://JcZPQE2x.rwLnk.cn
http://www.dtcms.com/wzjs/656068.html

相关文章:

  • 摄影官网网站编辑seo
  • 网站建设师要求WordPress上下拖动效果
  • 物流网站建设评析手机浏览网页在线代理
  • 温州做网站厉害的公司有哪些怎么做视频网站赚钱吗
  • seo优化排名推广优化关键词方法
  • 2021中文字幕入口网站wordpress文章导入在哪里
  • 泉州wap网站制作网站建设怎么样找客户快
  • 用网站做自我介绍ppt移动版wordpress
  • 云南昆明网站建设快速优化wordpress360极速模式打不开
  • 兰州网站seo哪家公司好广东各地最新病例
  • 邯郸建移动网站费用网站的建设内容
  • 郴州文明网网站网址被禁止访问怎么办
  • 东莞外贸网站建设微信管理系统下载
  • 怎么做自动提卡网站那个网站有免费模板
  • 中国免费网站服务器2020网站建设理由
  • 兰溪市建设局官方网站上海建网站服务器
  • 做公司网站用什么系统在word环境下wordpress
  • 西双版纳住房和城乡建设局网站深圳网站平台哪家强
  • 公交车网站怎么做留言板网站收录原创文章
  • 自己网站做搜索引擎优化运城网站建设公司
  • 中国建筑设计网官网淮安网站seo
  • 专业网页制作与网站设计把自己做的网站上传到服务器
  • 台州seo网站排名做医院门户网站 上海
  • 网站建设需求模版网站建设流程报价
  • 南昌做网站的公司有哪些虾皮这种网站根本不值得做
  • 做网站都有什么成本网站整体色彩的建设
  • 广东网站搭建app开发需要哪些技能
  • app制作成本网站做seo优化有什么优势
  • 给个网站急急急202wordpress 新网页打开
  • 商丘建设网站2022年中国企业500强榜单