当前位置: 首页 > wzjs >正文

赛车pk10计划网站建设南通网站的优化

赛车pk10计划网站建设,南通网站的优化,东营市建设局网站,优秀个人网页阿里达摩院开源大型端到端语音识别工具包FunASR: FunASR提供了在大规模工业语料库上训练的模型,并能够将其部署到应用程序中。工具包的核心模型是Paraformer,这是一个非自回归的端到端语音识别模型,经过手动注释的普通话语音识别…

阿里达摩院开源大型端到端语音识别工具包FunASR:

FunASR提供了在大规模工业语料库上训练的模型,并能够将其部署到应用程序中。工具包的核心模型是Paraformer,这是一个非自回归的端到端语音识别模型,经过手动注释的普通话语音识别数据集进行了训练,该数据集包含60,000小时的语音数据。为了提高Paraformer的性能,本文在标准的Paraformer基础上增加了时间戳预测和热词定制能力。此外,为了便于模型部署,本文还开源了基于前馈时序记忆网络FSMN-VAD的语音活动检测模型和基于可控时延Transformer(CT-Transformer)的文本后处理标点模型,这两个模型都是在工业语料库上训练的。这些功能模块为构建高精度的长音频语音识别服务提供了坚实的基础,与在公开数据集上训练的其它模型相比,Paraformer展现出了更卓越的性能。 FunASR 的中文语音转写效果比 Whisper 更优秀。

一、环境配置

https://github.com/modelscope/FunASR

conda create -n funasr python=3.9conda activate funasrconda install pytorch==2.3.1 torchvision==0.18.1 torchaudio==2.3.1 pytorch-cuda=11.8 -c pytorch -c nvidiapip install -U funasrpip install -U modelscope huggingface_hub

二、简单示例

需要下载模型

1.非流式

from funasr import AutoModel
from funasr.utils.postprocess_utils import rich_transcription_postprocessmodel_dir = "iic/SenseVoiceSmall"model = AutoModel(model=model_dir,vad_model="fsmn-vad",vad_kwargs={"max_single_segment_time": 30000},device="cuda:0",
)# en
res = model.generate(input=f"{model.model_path}/example/en.mp3",cache={},language="auto",  # "zn", "en", "yue", "ja", "ko", "nospeech"use_itn=True,batch_size_s=60,merge_vad=True,  #merge_length_s=15,
)
text = rich_transcription_postprocess(res[0]["text"])
print(text)

英文识别: 

中文识别: 

2.流式

from funasr import AutoModelchunk_size = [0, 10, 5] #[0, 10, 5] 600ms, [0, 8, 4] 480ms
encoder_chunk_look_back = 4 #number of chunks to lookback for encoder self-attention
decoder_chunk_look_back = 1 #number of encoder chunks to lookback for decoder cross-attentionmodel = AutoModel(model="iic/paraformer-zh-streaming")import soundfile
import oswav_file = os.path.join(model.model_path, "example/asr_example.wav")
speech, sample_rate = soundfile.read(wav_file)
chunk_stride = chunk_size[1] * 960 # 600mscache = {}
total_chunk_num = int(len((speech)-1)/chunk_stride+1)
for i in range(total_chunk_num):speech_chunk = speech[i*chunk_stride:(i+1)*chunk_stride]is_final = i == total_chunk_num - 1res = model.generate(input=speech_chunk, cache=cache, is_final=is_final, chunk_size=chunk_size, encoder_chunk_look_back=encoder_chunk_look_back, decoder_chunk_look_back=decoder_chunk_look_back)print(res)

三、服务器部署 

ASR\FunASR-main\runtime\python\websocket

python funasr_wss_server.py

运行服务器端:

 运行客户端:即可使用麦克风,进行实时转录。

python funasr_wss_client.py

 运行html5页面:E:\shuziren\ASR\FunASR-main\runtime\html5\static

 


文章转载自:

http://RSAVKH0R.wnnts.cn
http://Rm2g410c.wnnts.cn
http://SFLkSgcp.wnnts.cn
http://WBZzGXSa.wnnts.cn
http://kquvVcsv.wnnts.cn
http://Pau0qMv4.wnnts.cn
http://npEMFCd4.wnnts.cn
http://851b9inY.wnnts.cn
http://YGOMGXrN.wnnts.cn
http://N1v1dWVE.wnnts.cn
http://q0gzLVJk.wnnts.cn
http://2mWcLGWC.wnnts.cn
http://PLVqUIK2.wnnts.cn
http://yOWbhHJk.wnnts.cn
http://eZ4zQLst.wnnts.cn
http://Gvl0EsgH.wnnts.cn
http://p0VcRNJn.wnnts.cn
http://Ue5YHpsv.wnnts.cn
http://vvVnLrS3.wnnts.cn
http://oOgkNT1A.wnnts.cn
http://8pRmxdvn.wnnts.cn
http://C41uVDGc.wnnts.cn
http://TpcDMHFK.wnnts.cn
http://hJbfw4S4.wnnts.cn
http://ixzqx8N5.wnnts.cn
http://pnE8V7MZ.wnnts.cn
http://WAmu29Di.wnnts.cn
http://4hxVFhCl.wnnts.cn
http://g7GoTJSq.wnnts.cn
http://Szc1xzOy.wnnts.cn
http://www.dtcms.com/wzjs/693209.html

相关文章:

  • 长沙哪里可以做网站东莞企业自助建站系统
  • 官方网站怎么注册哪个网站做h5比较好
  • 营销型网站设计建设网站seo方案建议
  • 男女在床上做暖暖插孔视频网站设计师招聘网站有哪些
  • 广州专业网站开发在家做网站
  • 平阳高端网站建设安徽品质网站建设创新
  • 衡水网站建设培训学校建设网站的报价
  • 鱼馆网站的前期策划去掉 wordpress.org
  • 免费个人简历制作网站mm131爬虫wordpress
  • 网络营销的特点及形式天津网站建设seo优化
  • 子域名的网站放到哪里去公司网站备案网址
  • 网站建设与维护相关知识wordpress+免备案空间
  • 建网站用什么工作站网站怎么快速排名
  • 什么是网站维护南宁seo做法价格
  • 做网站的流程与步骤南昌vr网站开发
  • 博物馆设计网站推荐wordpress维护模式
  • 揭阳网站设计公司任何网络项目开始的第一步
  • 网站做ulr跳转百度高级搜索引擎入口
  • 创立网站做电商前端做网站直播
  • 做网站建设的网站天津建站服务
  • 学网站开发工作好找吗网站 如何做后台维护
  • 公司的网站建设价格低手机网站建设公司推荐
  • 关于网站建设领导分工北京高端网站建设有限公司
  • 网站开发可以用哪些语言简单做图网站
  • 制作购物网站需要多少钱成都网站快速排名软件
  • 网站毕业设计任务书外贸网站设计制作优化推广
  • 网站开发学习方法北京住房投资建设中心网站首
  • 网站系统设计目标wordpress插件 收费下载资源
  • html5 网站模板 米交通信用网站建设
  • 伴奏网站防盗是怎么做的销售网站开发