当前位置: 首页 > news >正文

freeswitch集成离线语音识别funasr

前言

教程只记录流程和重点环节,不记录详细代码

前面记录过freeswitch对接阿里的NlsSdkCpp3.X实现语音质检功能,NlsSdkCpp3.X服务是在线服务,费用可能对用户造成一定压力。所以本次记录下freeswitch对接阿里的离线语音识别funasr,通过对接funasr可以实现语音质检、智能客服实时语音交互等功能(打断、静音检测、识别修改等)。以下纪录本次集成过程,如有商务合作可主页联系,提供freeswitch的开发和各类asr、tts产品开发以及完整呼叫中心产品(可二次开发扩展)

流程图

流程中至画了本次涉及内容,其实在识别结果服务后还可以加nlp模型用来检索应答。这样lua中就可以直接做应答操作。

黄色、绿色部分是不同流程,二选一即可,需要自行修改。本次按照黄色部分开发,因为后续要检索应答,绿色流程是模块将识别结果放到通道参数中,lua从通道参数中获取,后续lua将识别结果发送给应答服务获取应答。另外模块中也可以将识别结果放到event中,通过esl获取识别结果,不过多赘述

安装

一、freeswitch-1.10.5.-release

freeswitch选择的版本是1.10.5.-release。因为后续用的的mod_fun_asr有版本限制,我是根据mod源码中调用freeswitch方法去freeswitch中找对应符合版本的。向上版本应该都可以,但是之前的1.6版本是不行的。安装方法参照以下链接

centos7.9下安装freeswitch-1.10.5.-release详细教程(极其简单)

二、mod_fun_asr

对接funasr服务的模块,github或geegit上不少,随便找个就行。找不到的用我编译好的

mod_fun_asr

xml文件放到/usr/local/freeswitch/conf/autoload_configs目录下,so文件放到/usr/local/freeswitch/mod下

/usr/local/freeswitch/conf/autoload_configs/modules.conf.xml下增加<load module="mod_fun_asr"/>

freeswitch启动后控制台执行load mod_fun_asr

注意xml中修改ws地址和识别传送地址。识别接收服务自己搭建,ws地址是下面阿里服务启动的地址。

三、阿里funasr语音识别服务

https://github.com/modelscope/FunASR/blob/main/runtime/docs/SDK_advanced_guide_online_zh.md

参照里面教程安装即可

四、lua逻辑

逻辑控制需要lua来实现,语音交互流程就是在脚本中放音同时检测识别信号(模块中以实现,有信号输入后通道变量speak_result=1),当检测到输入信号后打断放音,同时获取识别或应答结果,之后就是循环上述流程。lua中放音可以用uuid_displace不阻塞进程,playback阻塞进程

http://www.dtcms.com/a/422877.html

相关文章:

  • 建设网站管理规定源码做网站图文教程
  • Qt 入门:构建跨平台 GUI 应用的强大框架
  • Spring WebFlux调用生成式AI提供的stream流式接口,实现返回实时对话
  • 【学习笔记】高质量数据集
  • 微美全息科学院(WIMI.US):互信息赋能运动想象脑电分类,脑机接口精度迎来突破!
  • 协议 NTP UDP 获取实时网络时间
  • 公司网站可以分两个域名做吗残疾人网站服务平台
  • spark pipeline 转换n个字段,如何对某个字段反向转换
  • 学习React-18-useCallBack
  • 长沙制作网站的公司与传统市场营销的区别与联系有哪些
  • 从语言到向量:自然语言处理核心转换技术的深度拆解与工程实践导论(自然语言处理入门必读)
  • 无人设备遥控器之无线发射接收技术篇
  • 《从数组到动态顺序表:数据结构与算法如何优化内存管理?》
  • 浏览器正能量网站2021网页设计免费模板图片
  • 花生壳内网穿透网站如何做seo优化目前最好的找工作平台
  • 1-wireshark网络安全分析——VLAN基础细节详解
  • android studio 无法运行java main()
  • 如何用 Claude Code 搭建安全、可测、可自动化的 GitHub CI 流程?
  • K6的CI/CD集成在云原生应用的性能测试应用
  • Selective Kernel Networks 学习笔记
  • wordpress 浮动留言框搜索引擎优化是什么工作
  • UNIX下C语言编程与实践9-UNIX 动态库创建实战:gcc 参数 -fpic、-shared 的作用与动态库生成步骤
  • 无锡市建设工程质量监督站网站三星网上商城投诉电话
  • Cesium快速入门到精通系列教程十九:Cesium 1.95 中地图模式
  • 内网穿透部署
  • port hybrid pvid vlan vlan-id 概念及题目
  • 十大高端网站定制设计在线制作图片的软件
  • sentinel docker gateway k8s 集群 主从
  • 嘉兴高端网站定制进销存软件排行榜前十名
  • 一个wordpress的爱好者北京关键词优化平台