当前位置: 首页 > news >正文

‌FunASR‌阿里开源的语音识别工具

FunASR‌是一个由阿里云智能团队开源的语音识别工具。它旨在通过发布工业级语音识别模型的训练和微调,促进学术研究和工业应用之间的交流,推动语音识别生态的发展‌。

图片

今天来试着搭建下。

1、先贴上github地址。

https://github.com/modelscope/FunASR

2、创建环境

conda create -n funasr python==3.10

后台回复“conda”可拿到Ubuntu conda安装包

3、安装

安装方式我看着有三种,一种docker安装。一种源码安装。一种直接安装

咱们先来体验下直接安装的方式

pip install -U funasr

4、安装比较顺利,直接安装成功。试着运行下。

funasr ++model=paraformer-zh ++vad_model="fsmn-vad" ++punc_model="ct-punc" ++input=asr_example_zh.wav

5、运行后会先下载模型

图片

这个模型比较小,下载得很快。

接着再试下。报错了,看着是参数不对。

图片

5、代码执行下试试

from funasr import AutoModel# paraformer-zh is a multi-functional asr model# use vad, punc, spk or not as you needmodel = AutoModel(model="paraformer-zh",  vad_model="fsmn-vad",  punc_model="ct-punc",                   # spk_model="cam++",                   )res = model.generate(input=f"{model.model_path}/example/asr_example.wav",                      batch_size_s=300,                      hotword='魔搭')print(res)

图片

OK,完美运行。

搜到一个funasr的网站,不知道是不是官网,上面提供安装包https://funasr.com/#/

这就是简单的复现方法,如果大家在搭建的过程中有什么问题的话,欢迎留言,大家一起讨论学习。

相关文章:

  • 使用 ECharts GL 实现交互式 3D 饼图:技术解析与实践
  • WHAT - 冷启动和热启动
  • 屎上雕花系列-2nd
  • STL?vector!!!
  • 数据可视化大屏——物流大数据服务平台(二)
  • 2025年API安全防御全解析:应对DDoS与CC攻击的智能策略
  • 每天五分钟深度学习框架pytorch:视觉工具包torchvison
  • 什么是直播美颜SDK?跨平台安卓、iOS美颜SDK开发实战详解
  • 【递归,搜索与回溯算法篇】专题(一) - 递归
  • Python爬虫(22)Python爬虫进阶:Scrapy框架动态页面爬取与高效数据管道设计
  • 【官方题解】StarryCoding 入门教育赛 2 | acm | 蓝桥杯 | 新手入门
  • NLP基础
  • Java 23种设计模式 - 结构型模式7种
  • c++:迭代器(Iterator)
  • git相关
  • 今日行情明日机会——20250509
  • 从设计到开发,原型标注图全流程标准化
  • 深度学习 ———— 迁移学习
  • 自动驾驶的“眼睛”:用Python构建智能障碍物检测系统
  • 2025医疗信息化趋势:健康管理系统如何重构智慧医院生态
  • 男子服用头孢后饮酒应酬致昏迷在家,救援人员破门施救后脱险
  • 8000余万元黄金投入研发后“不知去向”,咋回事?
  • 商务部:对原产于美国、欧盟、台湾地区和日本的进口共聚聚甲醛征收反倾销税
  • 广西桂林、百色、河池等地表态:全力配合中央对蓝天立的审查调查
  • 李洋谈美国黑帮电影与黑帮文化
  • 著名文博专家吴远明因交通事故离世,享年75岁