当前位置: 首页 > wzjs >正文

上海网站原型设计网站建设关键词排名

上海网站原型设计,网站建设关键词排名,太湖云建站网站建设,没有营业执照怎么样做百度企业网站手机FunASR识别SIM卡通话占用内存和运行性能分析 --本地AI电话机器人 上一篇:手机无网离线使用FunASR识别SIM卡语音通话内容 下一篇:手机通话语音离线ASR识别商用和优化方向 一、前言 书接上一文《阿里FunASR本地断网离线识别模型简析》,…

手机FunASR识别SIM卡通话占用内存和运行性能分析

--本地AI电话机

上一篇:手机无网离线使用FunASR识别SIM卡语音通话内容

下一篇:手机通话语音离线ASR识别商用和优化方向


  • 一、前

书接上一文《阿里FunASR本地断网离线识别模型简析》,我们其实在2023年底的时候输出过一版基于离线FunASR的ASR转文字方案。当时为了减少模型文件的数量和大小,只引入了【vad_res】、【asr_offline_res】这两个模型文件,想尝试减少Android应用需要加载的文件内容,进而提高加载速度并减少运行内存的占用。但后来实践发现响应太慢了,体验效果不理想,而且识别准确率也不太行。

在这一版本中,我们从从魔搭社区中搜索最新的ONNX模型库,引入【punc_res】、【asr_online_res】这几个能提高ASR识别准确度但体积比较大(运行时比较消耗内存)的模型文件。

初步估计,模型文件本身将从208Mb增长到667Mb,足足增加了460Mb(主要是【punc_res】标点符号库增大了模型文件的大小)。

App运行内存从原先未加载ASR模块的250Mb,加载旧版本ASR后为700Mb,加载新版本ASR后为990Mb,一下子递增了很多。

通常,现在市面上普通的Android手机的运行内存大致为8G/16G/32G,极少部分较少的如乐视酷派金立这种能找到4G内存的。我们试着安装过,识别效率基本相差不大,都是说话后两三秒才能出文字。

本篇章中我们尝试从内存占用和运行性能的角度,分析一下将FunASR的运行动态库以及模型文件,直接加载到Android上进行本地解析是否靠谱。

魔搭社区中FunASR下载参考路径如下:

ModelScope - 模型列表页

体验和下载地址:

智能拨号器App:http://120.78.211.195:8060/Dialer.apk

拨号器SDK示例app:http://120.78.211.195:8060/sdk/SdkDemo.apk

USB蓝牙配件购买路径(参考):https://item.taobao.com/item.htm?_u=pk10l4ccbcd&id=649368472986

  • 二、实时流式+标点模型引入对性能的影响

经初步分析,把FunASR的【vad_res】、【asr_online_res】、【asr_offline_res】、【punc_res】这四件套都给引入App中进行ASR识别,确实能带来体验效果的提升。交互的友好性也能极大的增强。

但总体来说,感觉现阶段的FunASR模型也只能在通话事后根据录音进行质检上发力,在实时语音流上,不太可能像“小爱通话”这种能快速解析出对方说话的内容,然后根据对话上下文形成应答TTS语音做反馈。

性能对比影响大致如下表所示:

仅离线ASR(旧方案)

实时流+标点(新方案)

CPU占用

14%左右

11%-15%之间

内存占用

700-750Mb

980-1100Mb

识别准确率

中等,偶现错别字但不影响理解

高,标点模型会做最终修正

反应速度

2-8s出文字,一口气说的内容越长就需要等待越久。

2s左右出文字,但最终修正同样依赖asr_offline_res模型输出的结果做修正

  • 三、AndroidStudio的Profiler性能分析

由于我们在【拨号器SDK示例app】界面中增加了可以随时挂载和清除ASR识别模块的操作入口,因此可以很容易的在AndroidStudio的Profiler界面中对App运行中CPU占用、内存分配情况、以及耗电情况进行图形化的展示。

App加载so库和ASR模型文件后,App运行的内存由250Mb增大到980Mb。CPU耗用大致为11%-15%之间,如下图所示:

从运算性能上来看,这么点CPU耗用对于音视频领域的应用而言完全不算个事。但内存耗用方面把所有的模型文件都加载到手机内存中,然后依赖手机CPU来进行ASR运算对于手机这小身板而言,算是个不小的负担。

而且我们从最终实践的效果来看,对于那种“新闻联播”式的语音,一说话就巴拉巴拉停不下来的,asr_offline_res模型解析起来会急剧的增大文字的输出时间。

  • 四、总结

本文中尝试从内存占用和运行性能的角度,分析一下将FunASR的运行动态库以及模型文件,直接加载到Android后在CPU性能、内存耗用方面的使用情况。进而分析Android手机直接使用FunASR模型进行本地解析是否靠谱。

从结果上来看,目前选型的模型库和算法,对SIM卡电话通话事后根据录音进行质检方面效果比较理想。但对于实时语音流,特别是像那种“新闻联播”式的语音,一说话就巴拉巴拉停不下来的,FunASR在实时文字输出上体验效果不佳,总体解析的时延较久。

以上,大致为FunASR模型和算法装载到小小的Android手机上进行无网离线识别的试验效果。我们尝试通过“将大象直接装进房子里”的办法来实现“直接喂香蕉并收集大象做功的力气”这样力大砖飞的用法。

有兴趣的朋友或友商可以自行下载我们的App和ASR模型文件,体验通话和音质效果。

http://www.dtcms.com/wzjs/456738.html

相关文章:

  • 兰山区住房和城乡建设局网站网络推广课程培训
  • 建设网站空间多少钱班级优化大师官网
  • 做网站可以自由职业吗怎么开网店
  • wordpress文章竖线辽宁好的百度seo公司
  • 云主机怎么上传网站seo网络推广是什么意思
  • 网站设计价格大概多少seo推广小分享
  • 哈尔滨网站建设费用百度一下网页版浏览器百度
  • 网站推广排名教程搜索引擎优化怎么做的
  • 渭南做网站的公司厦门seo屈兴东
  • 做策划的人经常浏览的网站百度免费咨询
  • 上海专业做网站服务商百度客服中心人工在线电话
  • 手机网站开通微信支付搜索引擎营销的名词解释
  • 网站建设南昌网络销售怎么做才能有业务
  • 白云区新闻seo平台
  • 做网站开发的商标注册多少类南宁百度关键词排名公司
  • 免费网站建设 百度一下seo站内优化站外优化
  • 怎么创建收费网站google搜索免费入口
  • 东湖南昌网站建设公司网站制作的费用
  • 广东 网站建设怎样在浏览器上找网站
  • 成都网站建设 推广行南京seo培训
  • 好推建站千锋教育培训机构怎么样
  • 赣州企业网seo关键词快速排名软件
  • 怎么在搜索引擎里做网站网页自己怎样开网站
  • 网站图片计时器怎么做国内时事新闻
  • 手机怎么做电子书下载网站环球贸易网
  • 福田蒙派克10座车图片seo优化广告
  • html网站更新软文营销的成功案例
  • 太原建高铁站十大基本营销方式
  • 大学生兼职网站开发毕设论文有什么推广软件
  • 河津网站建设制作网站的步骤是什么