当前位置: 首页 > news >正文

语音识别-FunASR-docker部署-【超简洁步骤】

FunASR介绍

FunASR是一个开源的语音识别工具包,它旨在为开发者提供一个灵活且易于使用的平台,用于开发和部署自动语音识别(ASR)系统。FunASR支持多种语言,并提供了丰富的API接口,使得集成和定制化变得更加简单。这个项目通常包含一些最新的语音识别技术,如深度学习模型等,这些技术能够显著提高语音识别的准确率和效率。
源码地址https://github.com/modelscope/FunASR

部署

docker pull registry.cn-hangzhou.aliyuncs.com/funasr_repo/funasr:funasr-runtime-sdk-online-cpu-0.1.12
mkdir -p /data/funasr-runtime-resources/models
docker run -p 10095:10095 -d --name=funasr --privileged=true -v /data/funasr-runtime-resources/models:/workspace/models registry.cn-hangzhou.aliyuncs.com/funasr_repo/funasr:funasr-runtime-sdk-online-cpu-0.1.12

服务启动

# 进入funasr容器
docker exec -it funasr /bin/sh
cd FunASR/runtime

nohup bash run_server_2pass.sh \
  --download-model-dir /workspace/models \
  --vad-dir damo/speech_fsmn_vad_zh-cn-16k-common-onnx \
  --model-dir damo/speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-onnx  \
  --online-model-dir damo/speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-online-onnx  \
  --punc-dir damo/punc_ct-transformer_zh-cn-common-vad_realtime-vocab272727-onnx \
  --lm-dir damo/speech_ngram_lm_zh-cn-ai-wesp-fst \
  --itn-dir thuduj12/fst_itn_zh \
  --hotword /workspace/models/hotwords.txt > log.txt 2>&1 &

# 如果您想关闭ssl,增加参数:--certfile 0
# 如果您想使用SenseVoiceSmall模型、时间戳、nn热词模型进行部署,请设置--model-dir为对应模型:
#   iic/SenseVoiceSmall-onnx
#   damo/speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-onnx(时间戳)
#   damo/speech_paraformer-large-contextual_asr_nat-zh-cn-16k-common-vocab8404-onnx(nn热词)
# 如果您想在服务端加载热词,请在宿主机文件./funasr-runtime-resources/models/hotwords.txt配置热词(docker映射地址为/workspace/models/hotwords.txt):
#   每行一个热词,格式(热词 权重):阿里巴巴 20(注:热词理论上无限制,但为了兼顾性能和效果,建议热词长度不超过10,个数不超过1k,权重1~100)
# SenseVoiceSmall-onnx识别结果中“<|zh|><|NEUTRAL|><|Speech|> ”分别为对应的语种、情感、事件信息

快速测试-自动demo

在源码目录下的runtime/html5/static路径,直接在浏览器打开index.html

设置wss://127.0.0.1:10095

要关闭ssl加上--certfile 0参数就可以。

插入个人广告,不喜欢可以不用往下看了

搭建属于你自己的WEB堡垒机系统,只要有浏览器就可以远程控制你的电脑,协议支持rdp,vnc,ssh
官方地址:百百WEB堡垒机 http://bb.yun-api.com/

http://www.dtcms.com/a/61205.html

相关文章:

  • Manus:成为AI Agent领域的标杆
  • 题解:CF633D Fibonacci-ish
  • 如何安装MySQL,以及数据库表格创建并插入数据
  • 微前端如何拯救大型项目
  • Sglang部署大模型常用参数详解
  • 《 PyQt5》—— 创建 Python GUI(图形用户界面)
  • 《PyQt5》——设计Python GUI(图形用户界面)实例
  • 开关模式电源转换器 EMI/EMC 的集成仿真
  • 查看电脑信息
  • STM32的Systick定时器的作用
  • 每日一题——只出现一次的数字
  • vue3:一文理解h函数的使用
  • SpringbootActuator未授权访问漏洞
  • 优选算法系列(1. 双指针_上)
  • 转和git subtree管理方式为git submodule的管理方式
  • Fast DDS Security--两方秘钥存在的问题
  • 【Linux系统】进程状态:一个进程的轮回史
  • 技术聚焦:Debezium 如何将数据库数据精准注入 Kafka
  • Ubuntu 22.04 升级到 Ubuntu 24.04 全流程指南
  • 群晖DS223 Docker搭建为知笔记
  • 【每日八股】Golang篇(三):关键字(下)
  • 【论文解读】《START: Self-taught Reasoner with Tools》
  • 2025年网络安全(黑客技术)120天自学手册
  • 面向高质量视频生成的扩散模型方法-算法、架构与实现【附核心代码】
  • SQLAlchemy系列教程:如何执行原生SQL
  • 【网络安全 | 漏洞挖掘】$15,000——通过持久token获取个人身份信息(PII)
  • 小智智能体语言大模型硬件软件开发
  • Linux 使用 docker 安装 Gogs 公司私有 Git 仓库
  • vue打包编译【自动删除node_modules下的.cache缓存文件夹】
  • Linux 系统负载过高的排查思路