当前位置: 首页 > wzjs >正文

我想建个网站外贸拓客软件

我想建个网站,外贸拓客软件,四川工程造价信息网,天津信息港语音识别技术(Automatic Speech Recognition)是一种将人的语音转换为文本的技术。在智能问答中,可通过语音接入用户query,实现问答。 在流式语音识别系统中,客户端不断地将音频数据实时传输至服务器,而服务…

语音识别技术(Automatic Speech Recognition)是一种将人的语音转换为文本的技术。在智能问答中,可通过语音接入用户query,实现问答。

在流式语音识别系统中,客户端不断地将音频数据实时传输至服务器,而服务器则负责对这些数据进行即时语音识别,并将识别出的文本结果实时回传给客户端。

PaddleSpeech,采用WebSocket协议来确保客户端与服务器之间能够长时间稳定地保持连接。WebSocket协议以其支持全双工通信的特性而著称,在同一网络连接上,客户端和服务器可以同时发送和接收消息,无需像传统HTTP请求那样频繁地建立和断开连接。

流式 TTS 服务支持 http 和 webscoket 两种协议。

http 支持流式返回,可以满足目前的流式 TTS 的方案,即请求一次,返回流式数据,响应返回结束会自动断开连接。

而 websocket 支持双工,适用于需要长连接的场景,也可应用于目前的流式 TTS 的方案,可以在一次连接中请求多次,相比 http 请求多次而言,可减少建立连接的次数。

除此之外,流式 ASR 使用的是 websocket 协议,使用 webscoket 协议启动服务,可以同时启动包含流式 ASR 和流式 TTS 的服务。

访问流式 TTS 服务流程图(左:访问 http 服务;右:访问 websocket 服务)

客户端操作:

  1. client 端向 server 端发送 http 请求(在这个过程中,client 端会先向 server 端发送建立连接请求并和 server 端建立连接)
  2. server 端收到请求后先检查字段内容是否有效,然后去引擎池取对应的引擎
  3. 引擎进行推理生成合成音频,将其封装成设计的响应格式,返回响应到 client 端,并自动断开连接
  4. client 端收到响应后,对其结果进行后处理(保存音频操作)
    async with websockets.connect('ws://ip:8090/paddlespeech/asr/streaming') as ws:# 第一次调用需要发送开始指令audio_info = json.dumps({"name": "test.wav", "signal": "start", "nbest": 1})await ws.send(audio_info)msg = await ws.recv()# {'status': 'ok', 'signal': 'server_ready'}msg = json.loads(msg)print(msg)# 输出内容长度length = 0# 计算在给定的采样率(RATE)、数据块大小(CHUNK)和录制时长(RECORD_SECONDS)下,需要读取多少个数据块来完成整个录制过程。print(int(RATE / CHUNK * RECORD_SECONDS))for i in range(0, int(RATE / CHUNK * RECORD_SECONDS)):data = stream.read(CHUNK)await ws.send(data)msg = await ws.recv()# {'result': ''}msg = json.loads(msg).........# 发送结束指令audio_info = json.dumps({"name": "test.wav", "signal": "end", "nbest": 1})await ws.send(audio_info)msg = await ws.recv()# {'status': 'ok', 'signal': 'finished', 'result': '', 'times': [{'w': '', 'bg': 0.0, 'ed': 0.68}, ...]}msg = json.loads(msg)if tag and len(msg['result']) > 0:punc_text = punc(msg['result'])msg['result'] = punc_textprint(msg['result'])

服务端:

  1. 准备服务对应的配置参数文件,文件内包含该服务启动使用的模型相关信息和服务端口,引擎选择的相关信息
  2. 根据配置文件中引擎的选择将对应的引擎加入到引擎池中(该步骤的目的是为了使得启动的服务入口可以支持多个语音服务)
  3. 根据配置文件中的模型配置对上述对应的引擎进行初始化
  4. 使用 fastapi 和 uvicorn 启动服务
from paddlespeech.server.bin.paddlespeech_server import ServerExecutorserver_executor = ServerExecutor()
server_executor(config_file="./conf/application.yaml",log_file="./log/paddlespeech.log")

注:部分内容摘自百度飞桨平台。

http://www.dtcms.com/wzjs/582210.html

相关文章:

  • 做医学网站福州网站外包
  • 织梦网站怎么做伪静态页面建设银行云南分行招聘网站
  • 学习网站开发药监局网站建设方案
  • 网站换空间不换域名对seo有影响吗镇江网站制作哪家便宜
  • 网站开元棋牌怎么做app域名会影响网站排名吗
  • 陇南市响应式网站建设辽宁建设工程信息网登录入口官方
  • 达濠市政建设有限公司网站孝义做网站的公司
  • 济南做网站公司电话装饰设计素描
  • 广州做企业网站的公司现在有哪些网址
  • 东莞优化网站制作怎样建设美食网站
  • thinkphp网站优化软件激活码商城
  • 海外推广的网站有哪些数据库网站建设方案
  • 影响网站用户体验如何建立自己网站视频教程
  • 农业网站建设方案 ppt模板站长之家网站排名
  • 吉安网站制作微应用和微网站的区别是什么
  • 门户网站 特点手机优化管家
  • 高端网站建设步骤手机价格
  • 手机网站会员识别功能公司注册有限公司
  • 云服务器可以建网站吗手机触屏网站幻灯片
  • asp.net网站建设实战 pdf营销类网站有哪些
  • 湖南专业建站按效果付贿中国建设银行官方网站下载
  • 商业网站域名做外贸都做哪些网站好免费
  • 想建个板栗网站怎么做软件开发公司排名
  • 国外音乐网站设计遵义网站制作和推广
  • 检察院门户网站建设即墨专业医院网站制作公司
  • 做房产网站长网站开发工作协议书范本
  • 美工做网站尺寸多少网页设计参考板式
  • 遂宁网站建设哪家好外贸开发网站公司
  • 网站关键词选择免费家装设计效果图
  • 做网站怎么挣钱最快建设简易电子商务网站流程图