当前位置: 首页 > wzjs >正文

网站建设有哪些项目最近一周的新闻大事10条

网站建设有哪些项目,最近一周的新闻大事10条,专业足球网站建设,做教育的需要做个网站吗阿里达摩院开源大型端到端语音识别工具包FunASR: FunASR提供了在大规模工业语料库上训练的模型,并能够将其部署到应用程序中。工具包的核心模型是Paraformer,这是一个非自回归的端到端语音识别模型,经过手动注释的普通话语音识别…

阿里达摩院开源大型端到端语音识别工具包FunASR:

FunASR提供了在大规模工业语料库上训练的模型,并能够将其部署到应用程序中。工具包的核心模型是Paraformer,这是一个非自回归的端到端语音识别模型,经过手动注释的普通话语音识别数据集进行了训练,该数据集包含60,000小时的语音数据。为了提高Paraformer的性能,本文在标准的Paraformer基础上增加了时间戳预测和热词定制能力。此外,为了便于模型部署,本文还开源了基于前馈时序记忆网络FSMN-VAD的语音活动检测模型和基于可控时延Transformer(CT-Transformer)的文本后处理标点模型,这两个模型都是在工业语料库上训练的。这些功能模块为构建高精度的长音频语音识别服务提供了坚实的基础,与在公开数据集上训练的其它模型相比,Paraformer展现出了更卓越的性能。 FunASR 的中文语音转写效果比 Whisper 更优秀。

一、环境配置

https://github.com/modelscope/FunASR

conda create -n funasr python=3.9conda activate funasrconda install pytorch==2.3.1 torchvision==0.18.1 torchaudio==2.3.1 pytorch-cuda=11.8 -c pytorch -c nvidiapip install -U funasrpip install -U modelscope huggingface_hub

二、简单示例

需要下载模型

1.非流式

from funasr import AutoModel
from funasr.utils.postprocess_utils import rich_transcription_postprocessmodel_dir = "iic/SenseVoiceSmall"model = AutoModel(model=model_dir,vad_model="fsmn-vad",vad_kwargs={"max_single_segment_time": 30000},device="cuda:0",
)# en
res = model.generate(input=f"{model.model_path}/example/en.mp3",cache={},language="auto",  # "zn", "en", "yue", "ja", "ko", "nospeech"use_itn=True,batch_size_s=60,merge_vad=True,  #merge_length_s=15,
)
text = rich_transcription_postprocess(res[0]["text"])
print(text)

英文识别: 

中文识别: 

2.流式

from funasr import AutoModelchunk_size = [0, 10, 5] #[0, 10, 5] 600ms, [0, 8, 4] 480ms
encoder_chunk_look_back = 4 #number of chunks to lookback for encoder self-attention
decoder_chunk_look_back = 1 #number of encoder chunks to lookback for decoder cross-attentionmodel = AutoModel(model="iic/paraformer-zh-streaming")import soundfile
import oswav_file = os.path.join(model.model_path, "example/asr_example.wav")
speech, sample_rate = soundfile.read(wav_file)
chunk_stride = chunk_size[1] * 960 # 600mscache = {}
total_chunk_num = int(len((speech)-1)/chunk_stride+1)
for i in range(total_chunk_num):speech_chunk = speech[i*chunk_stride:(i+1)*chunk_stride]is_final = i == total_chunk_num - 1res = model.generate(input=speech_chunk, cache=cache, is_final=is_final, chunk_size=chunk_size, encoder_chunk_look_back=encoder_chunk_look_back, decoder_chunk_look_back=decoder_chunk_look_back)print(res)

三、服务器部署 

ASR\FunASR-main\runtime\python\websocket

python funasr_wss_server.py

运行服务器端:

 运行客户端:即可使用麦克风,进行实时转录。

python funasr_wss_client.py

 运行html5页面:E:\shuziren\ASR\FunASR-main\runtime\html5\static

 

http://www.dtcms.com/wzjs/466147.html

相关文章:

  • 做电脑网站用什么软件有哪些新闻热搜榜 今日热点
  • 白羊女做网站5118大数据平台官网
  • 部队网站制作app推广渠道商
  • wordpress获取作者的文章汕头seo代理商
  • 企业网站备案怎么办理阜新网络推广
  • 进入网站服务器怎么做计算机培训班
  • 在什么网站可以接活做苏州首页排名关键词优化
  • 电脑做网站服务器需要什么软件千博企业网站管理系统
  • 德国诺莫斯手表网站爱站网使用体验
  • 高端网站制作建设网络营销发展方案策划书
  • 长江商学院 网站建设免费网站制作教程
  • app商城需要手机网站吗app推广赚佣金
  • 连锁公司网站源码百度推广代理商与总公司的区别
  • seo推广用什么做网站好百度一下你就知道网页
  • 种子汤唯梁朝伟做视频网站查询网138网站域名
  • 怎么做网站链接百度搜索关键词技巧
  • 如何建设网站济南兴田德润简介电话万能引流软件
  • pc蛋蛋网站怎么做百度大数据预测平台
  • 装修网站模板友情链接网站
  • 如何创建网站 优帮云整合营销传播方案
  • wordpress速度插件关键词seo排名
  • 今天中国疫情最新情况seo日常优化内容是什么
  • 网站推荐几个免费的舆情信息报送
  • 公司企业网站建设多少钱今天重大新闻国内最新消息
  • 爱网站最新发布址公司产品怎样网上推广
  • 光明附近网站建设公司线上线下整合营销方案
  • 梅州市城乡建设部网站首页电脑上突然出现windows优化大师
  • 天津建站方案电商平台开发
  • 创意设计师个人网站浙江搜索引擎优化
  • office 网页制作软件关键词seo服务