当前位置: 首页 > news >正文

语音识别数据增强

目录

Whisper-Finetune的数据增强

其他数据增强:


Whisper-Finetune的数据增强

https://github.com/yeyupiaoling/Whisper-Finetune

https://github.com/yeyupiaoling/Whisper-Finetune/blob/master/configs/augmentation.json

[{"type": "resample","params": {"new_sample_rates": [8000, 32000, 44100]},"prob": 0.0},{"type": "noise","params": {"min_snr_dB": 10,"max_snr_dB": 50,"noise_dir": "dataset/noise"},"prob": 0.2},{"type": "speed","params": {"min_speed_rate": 0.9,"max_speed_rate": 1.1,"num_rates": 3},"prob": 0.5},{"type": "shift","params": {"min_shift_ms": -5,"max_shift_ms": 5},"prob": 0.0},{"type": "volume","params": {"min_gain_dBFS": -15,"max_gain_dBFS": 15},"prob": 0.5}
]

其他数据增强:

1.语音合成数据增强:

2.一段语音,一段文字,随意拆分的话,语音要拆分,文字也要对应拆分。

http://www.dtcms.com/a/302517.html

相关文章:

  • llama系列
  • 1688寻源通接口接入要点||电商API接口
  • 电脑ip地址在哪里看
  • 如何提升 TCP 传输数据的性能?详解
  • 信息收集工具ARL资产侦察灯塔系统搭建教程
  • 最新的前端技术和趋势(2025)
  • STM32启动流程
  • 防水医用无人机市场报告:现状、趋势与洞察
  • 无人机喷洒系统技术要点与难点解析
  • Go性能优化深度指南:从原理到实战
  • 机器学习与深度学习评价指标
  • 实战经验总结:如何快速理解一套完整的移动端设计规范
  • 代理 ARP 的三种应用场景:端口隔离、VLAN聚合、单臂路由
  • 在 Windows 系统 下直接使用了 Linux/macOS 的环境变量设置语法 PLATFORM=android
  • IP协议解析:从寻址到路由
  • 企业管理双核心:ERP 系统与 CRM 系统的功能对比
  • 跨境电商更换外模,无实景拍摄,制作商品图
  • 策略路由(PBR技术)
  • Cloudflare CDN 中设置地域限制并返回特定界面
  • Java排序算法之<归并排序>
  • ORA-13516: AWR Operation failed: CATPROC not valid
  • AT89C 系列单片机知识点总结
  • clion解决引入头文件后找不到函数实现:Undefined symbols for architecture x86_64
  • 《LeetCode 热题 100》整整 100 题量大管饱题解套餐 中
  • Ubuntu-安装S7nodave教程
  • Java面试宝典:MySQL事务和事务的隔离级别
  • C++现代Redis客户端库redis-plus-plus详解
  • Redis实战(3)-- 高级数据结构zset
  • Linux应用程序架构与软件包管理
  • 【Linux】基本指令(2)