当前位置: 首页 > news >正文

【indextts2】之四:ubuntu24.04 经常跑满12G 显存、音色与录制关系很大

输入的样本长,语音内容多,很容易超过12G

  • http://192.168.50.197:7860/
  • 4070 运行
  • 【pycharm】index-tts2:之三 :ubuntu24.04 体验tts demo 做了试用,
  • 感觉挺好的,完整的tts系统,音色提取的还行,但是跟样本输入有关,比如我录制的mp4 然后分离的mp3
  • 我感觉小朋友的声音还行,但是可能有点模糊? 所以提炼的音色缺少了小朋友的很多特色,几乎无法认为是小朋友本人。
  • 然后我用手机录音wav,小朋友的一些音色就能被indextts2 识别到了,但是也不是全部的。
  • 甚至我又录制了一个说话更密集的,还不如我第一个有点稀疏的,
  • 我不清楚决定音色的要素是什么,也行并不是 单位时间内语音信号的数量?
  • 后面将对 [什么决定音色?] 进行分析。
    在这里插入图片描述
  • 感觉借同学的不方便传递数据集,只能求助租一个服务器了?

显存耗尽就报错了

http://www.dtcms.com/a/389696.html

相关文章:

  • 【学习笔记】稳定币的技术原理与信任逻辑
  • 为 Elasticsearch Ruby Client 引入 ES|QL 查询生成器
  • 平安养老险陕西分公司积极开展“保障金融权益,助力美好生活”金融教育宣传周活动
  • 多线程的特点与同步、互斥锁
  • 将npm run dev 冷启动从 90s 优化到 8.5s的实践
  • 【附源码】基于SSM的小型银行贷款系统设计与实现
  • X-Forwarded-For
  • 中科大DSAI Lab团队多篇论文入选ICCV 2025,推动三维视觉与泛化感知技术突破
  • GitHub 上 Star 数量前 10 的开源项目管理工具
  • axios函数封装
  • NewSQL——核心原理与内部机制
  • 《从 0 到 1 打通网络服务任督二脉:域名、服务器与多站点配置全攻略》​
  • vue3学习日记(十七):动态路由使用解析
  • SpringBoot 启动流程
  • .NET驾驭Word之力:结构化文档元素操作
  • 解密F5负载均衡:优化网络性能的关键
  • 使用 .NET Core 6 Web API 的 RabbitMQ 消息队列
  • 时空预测论文分享:图时空注意力网络 ConvLSTM 时空演变
  • 千问大模型部署笔记
  • 网络:开源网络协议栈介绍
  • 设计模式(C++)详解—装饰器模式(3)
  • 双重锁的单例模式
  • 管理 Git 项目中子模块的 commit id 的策略
  • 跨境电商API数据采集的流程是怎样的?
  • rust编写web服务07-Redis缓存
  • 第三十三天:高精度运算
  • 写联表查询SQL时筛选条件写在where 前面和后面有啥区别
  • ARM(13) - PWM控制LCD
  • Python基础 3》流程控制语句
  • 牛客算法基础noob44——数组计数维护