当前位置: 首页 > news >正文

阿里FunASR语音转文字模型搭建

最近在做语音文件转换文字,FunASR正好可以在没有显卡的情况下运行起来,正适合练手。

1.环境要求

python+vscode(本文使用vscode)

python 需要 3.10.X 高于3.10X的版本不一定能用

注意vscode的右下方,选择运行环境要选本地安装的python环境。如果不用本地环境,则需要选择其他类似 conda创建的虚拟环境

2.安装funasr 库

pip install -U funasr

3.安装模型管理工具 ModelScope

pip install modelscope torchaudio

4.下载语音数据模型,我这里使用的是

modelscope download --model iic/speech_seaco_paraformer_large_asr_nat-zh-cn-16k-common-vocab8404-pytorch

模型介绍地址

https://modelscope.cn/models/iic/speech_paraformer_asr_nat-zh-cn-16k-common-vocab8404-online

下载好后,可以做一个简单的测试,使用官方例子:

from funasr import AutoModel# paraformer-zh is a multi-functional asr model# use vad, punc, spk or not as you needmodel = AutoModel(model="paraformer-zh", model_revision="v2.0.4",vad_model="fsmn-vad", vad_model_revision="v2.0.4",punc_model="ct-punc-c", punc_model_revision="v2.0.4",# spk_model="cam++", spk_model_revision="v2.0.2",)res = model.generate(input=f"{model.model_path}/example/asr_example.wav",batch_size_s=300,hotword='魔搭')print(res)

运行后效果如下:

官网的这个代码首次运行他会去下载对应的语音模型库。和我们前面单独下载的语音模型库不是同一个库。没关系,我们继续用手动下载的库来做离线项目。


5.下载的模型

我们刚刚手动下载的模型如上图标红部分。其他3个是运行官网demo自动下载的。

为了项目管理方便,我把手动下载的语音模型拷贝到项目目录下,自己取个名字

下面把模型改成本地路径即可测试。注意音频文件需要16 kHz、单声道、PCM 16-bit。

from funasr import AutoModel
import os# 指定模型缓存路径
local_model_path  = "./asr_nat-zh-pytorch"# 确保模型目录存在
if os.path.exists(local_model_path ):print("使用本地模型...")model = AutoModel(  model=local_model_path ,disable_update=True,  # 禁止更新,避免重复下载trust_remote_code=False)res = model.generate(input="./asr_example_zh.wav", batch_size_s=300)print(res)
else:print("没找到模型...")

运行效果如下:


文章转载自:

http://nvw7EpoP.ykwqz.cn
http://ivpA2QBK.ykwqz.cn
http://WPQODCxd.ykwqz.cn
http://FdBi7X0W.ykwqz.cn
http://bkXaTjqf.ykwqz.cn
http://yxacr6S8.ykwqz.cn
http://LNXxr3Ng.ykwqz.cn
http://0oHhr19f.ykwqz.cn
http://EKMHz9a4.ykwqz.cn
http://26lmukoT.ykwqz.cn
http://RdrqR4s0.ykwqz.cn
http://RGhIolWd.ykwqz.cn
http://bG52zan7.ykwqz.cn
http://tsAuPT4p.ykwqz.cn
http://JLVG1Q60.ykwqz.cn
http://vaNvGShI.ykwqz.cn
http://YSZbfAkc.ykwqz.cn
http://Wgnmhk91.ykwqz.cn
http://oaf4YaIu.ykwqz.cn
http://xbPtkT6y.ykwqz.cn
http://jDAAfi46.ykwqz.cn
http://ftyDF0nV.ykwqz.cn
http://xiW71spO.ykwqz.cn
http://rBwWJ4Vt.ykwqz.cn
http://N47Bp34x.ykwqz.cn
http://dUJlESr3.ykwqz.cn
http://9yemMLkx.ykwqz.cn
http://0NTn5sd5.ykwqz.cn
http://TDyqbLGS.ykwqz.cn
http://ZCV8inhQ.ykwqz.cn
http://www.dtcms.com/a/379082.html

相关文章:

  • Android8 binder源码学习分析笔记(三)
  • sizeof 和 strlen
  • 2025年度4款录音转文字工具横向对比
  • 教资科三【信息技术】— 学科知识(简答题)精简背诵版
  • 滚动列表展示跟随弹框效果
  • readelf 和 ldd 查看文件的依赖
  • 基于社交媒体数据的公众情绪指数构建与重大事件影响分析
  • Cosign 实战:构建可信容器镜像的签名与验证体系
  • 定时器实战:LED闪烁与呼吸灯调试
  • docker部署Gitlab社区版,步骤以及外网访问出现502的解决方式
  • FairGuard aab包签名工具
  • 企业文件图纸全自动加密怎么设置?三步实现自动防护!
  • Redis C++ 实现笔记(I篇)
  • [css] 实现禁止文本被选中
  • MATLAB中进行视觉检测入门教程
  • 人工智能深度学习——多层感知器(人工神经网络)
  • 2025最新超详细FreeRTOS入门教程:第十二章 FreeRTOS调度器与时间片管理
  • 软考系统架构设计师之项目管理篇
  • OpenSTL PredRNNv2 模型复现与自定义数据集训练
  • 基于STM32的单片机开发复盘
  • Git 目录详解和基本操作(1)
  • 机器学习之K折交叉验证
  • Android Gradle Project (AGP) gradle-xxxx-src.zip无法正常下载问题解决方法
  • 图观 应用编辑器 产品介绍
  • 探讨Hyperband 等主要机器学习调优方法的机制和权衡
  • Apple产品发布会拆解:体验下放、设计极限、AI 入耳
  • 如何解决 Spring Bean 循环依赖
  • sdio NOT_AUTOGATING
  • 华为X考拉悠然 联合发布悠然智擎城市交通拥堵治理空间智能体方案
  • 《微服务事务管理》