当前位置: 首页 > wzjs >正文

可信网站验证多少钱网站二级域名

可信网站验证多少钱,网站二级域名,简单的网页设计,北京网站建设 时创设计调整VAD参数 1. 查找VAD模型的配置文件 FunASR中的VAD模型为FSMN-VAD,参数配置类为VADXOptions,可以在以下路径中找到: /workspace/FunASR/runtime/python/onnxruntime/funasr_onnx/utils/e2e_vad.py 其中,VADXOptions类定义了…

调整VAD参数

1. 查找VAD模型的配置文件

FunASR中的VAD模型为FSMN-VAD,参数配置类为VADXOptions,可以在以下路径中找到:

/workspace/FunASR/runtime/python/onnxruntime/funasr_onnx/utils/e2e_vad.py

其中,VADXOptions类定义了多个VAD参数。以下是一些常见参数的定义:

class VADXOptions:sample_rate: int = 16000detect_mode: int = VadDetectMode.kVadMutipleUtteranceDetectMode.valuesnr_mode: int = 0max_end_silence_time: int = 800max_start_silence_time: int = 3000do_start_point_detection: bool = Truedo_end_point_detection: bool = Truewindow_size_ms: int = 200sil_to_speech_time_thres: int = 150speech_to_sil_time_thres: int = 150speech_2_noise_ratio: float = 1.0do_extend: int = 1lookback_time_start_point: int = 200lookahead_time_end_point: int = 100max_single_segment_time: int = 60000

这些参数控制了VAD的静音检测、语音与噪音之间的比率等。具体参数意义如下:

max_single_segment_time:单段音频的最大时长,默认60000毫秒(1分钟)。
max_end_silence_time:检测到结束静音的最大时长,默认800毫秒。
max_start_silence_time:检测到开始静音的最大时长,默认3000毫秒。
sil_to_speech_time_thres:从静音到语音的时间阈值,默认150毫秒。
speech_to_sil_time_thres:从语音到静音的时间阈值,默认150毫秒。

2. 修改VAD配置
VAD模型的实际配置是从模型目录中的config.yaml文件读取的。可以在以下路径找到config.yaml文件:

/workspace/models/damo/speech_fsmn_vad_zh-cn-16k-common-onnx/config.yaml

config.yaml文件中的model_conf字段包含了VAD模型的详细配置:

model: FsmnVADStreaming
model_conf:sample_rate: 16000detect_mode: 1snr_mode: 0max_end_silence_time: 800max_start_silence_time: 3000do_start_point_detection: Truedo_end_point_detection: Truewindow_size_ms: 200sil_to_speech_time_thres: 150speech_to_sil_time_thres: 150speech_2_noise_ratio: 1.0do_extend: 1lookback_time_start_point: 200lookahead_time_end_point: 100max_single_segment_time: 60000

3. 修改参数示例
假设你想减少静音端点的检测时间,可以将max_end_silence_time的默认值从800毫秒改为600毫秒。只需编辑config.yaml文件,将以下行:

max_end_silence_time: 800

改为:

max_end_silence_time: 600

这样,你的VAD模型将在600毫秒后检测到结束静音,适用于需要更快速响应的语音识别场景。

调优实践建议

​直播场景配置

{"max_single_segment_time": 30000,  // 30秒分段"max_end_silence_time": 500,       // 快速结束检测"max_start_silence_time": 1000,    // 过滤开场噪音"sil_to_speech_time_thres": 80,    // 敏感语音起始"speech_to_sil_time_thres": 200    // 宽松语音结束
}

​客服录音处理

{"max_single_segment_time": 60000,  // 保留完整对话"max_end_silence_time": 1500,      // 等待客户确认"enable_semantic_sentence_detection": true  // 语义分割
}

性能影响对比

参数	                        低值风险	            高值风险
max_single_segment_time	    语义割裂	            内存溢出
max_end_silence_time	    提前截断(漏识别)	    延迟结束(多噪声)
sil_to_speech_time_thres	噪音误触发	        语音起始漏检

部分参考链接如下:
https://blog.51cto.com/u_16732038/12047312

http://www.dtcms.com/wzjs/543846.html

相关文章:

  • 网站网络结构设计在线切图网站
  • 苏州网站建设系统找哪家舆情报告撰写
  • 福州网站推广公司wordpress dealers
  • win2003服务器网站管理工具wordpress发邮件收不到
  • 南京网站开发南京乐识行在阿里云安装wordpress
  • 怎么给网站做seo整站优化外包公司
  • 网站建站后维护需要做哪些wordpress全屏首页
  • 网站开发实施计划与安排群晖系统可以做网站吗
  • 玛迪网站建设网站开发需要看相关书籍
  • 如何做电商网站首页石家庄vi设计公司
  • 仙居网站开发网站设计机构排行榜
  • 浙江大学教室办事大厅网站建设做个网站 多少钱
  • 深圳苍松大厦 网站建设厦门网站建设报价
  • 网站建设痛点广东网页制作推广
  • 艺梵科技 网站建设wordpress通知邮件美化
  • 网站关键字多少个怎么做网站链接的快捷方式
  • 潍坊路通工程建设有限公司网站php网站开发案例pdf
  • 哈尔滨门户网站建设管理咨询公司有哪些
  • 公司做网站设计要注意微信微网站开发百度云
  • 上海网站制作设计公司天津百度推广中心
  • 网站联盟是什么嘉兴网站定制
  • wordpress软件网站模板下载网页传奇手游
  • 专做腰带的网站wordpress页面上下级
  • 做网站品免费个人网站+上传
  • 和各大网站做视频的工作总结湖南 seo
  • 用照片做视频的模板下载网站好关键字挖掘
  • 帮人做微信是哪个网站WordPress分类目录图标
  • 我的网站域名是什么咸阳网站网站建设
  • 江门网站建设推广平台WordPress启用主题无反应
  • 二级域名做网站注意徐州网站建设市场分析