当前位置: 首页 > news >正文

树莓派5+Vosk+python实现语音识别

简介

Vosk是语音识别开源框架,支持二十+种语言 - 中文,英语,印度英语,德语,法语,西班牙语,葡萄牙语,俄语,土耳其语,越南语,意大利语,荷兰人,加泰罗尼亚语,阿拉伯, 希腊语, 波斯语, 菲律宾语,乌克兰语, 哈萨克语, 瑞典语, 日语, 世界语, 印地语, 捷克语, 波兰语, 乌兹别克语, 韩国语, 塔吉克语。

模型下载链接:https://alphacephei.com/vosk/models/vosk-model-cn-0.15.zip

实验环境:

  1. 树莓派第5代
  2. usb麦克风

安装

pip install vosk -i https://pypi.tuna.tsinghua.edu.cn/simple --break-system-packages
pip install sounddevice -i https://pypi.tuna.tsinghua.edu.cn/simple --break-system-packages

将下载好的模型文件 vosk-model-cn-0.15.zip 上传到树莓派系统自定义的目录并解压,如图所示:

编写示例代码测试:

import sounddevice as sd
import vosk
import queue
import jsonq = queue.Queue()def callback(indata, frames, time, status):q.put(bytes(indata))def recognize_speech():model = vosk.Model(r"/home/work/vosk-model-cn-0.15") #模型文件路径with sd.RawInputStream(samplerate=16000, blocksize=8000, dtype='int16', channels=1, callback=callback):recognizer = vosk.KaldiRecognizer(model, 16000)print("请说话...")while True:data = q.get()if recognizer.AcceptWaveform(data):result = recognizer.Result()text = json.loads(result)["text"]print("你说的是: " + text)breakif __name__ == "__main__":recognize_speech()

运行结果示例:

相关文章:

  • 基于spring boot 集成 deepseek 流式输出 的vue3使用指南
  • 「数据可视化 D3系列」入门第十章:饼图绘制详解与实现
  • 03、GPIO外设(三):标准库代码示例
  • Spring Boot 核心注解全解:@SpringBootApplication背后的三剑客
  • JAVA Web_定义Servlet_处理POST请求【练习】
  • 部署路线Ubuntu_MySQL_Django_绑定域名
  • 如何构建跨平台可复用的业务逻辑层(Web、App、小程序)
  • edge browser for linux debian
  • 基于Django实现农业生产可视化系统
  • MyBatis如何配置数据库连接并实现交互?
  • 为您的照片提供本地 AI 视觉:使用 Llama Vision 和 ChromaDB 构建 AI 图像标记器
  • 第三阶段面试题
  • SpringBoot学习(properties、yml(主流)、yaml格式配置文件)(读取yml配置文件的3种方式)(详解)
  • 使用Lean 4和C#进行数学定理证明与逻辑推理
  • 【前沿】成像“跨界”测量——扫焦光场成像
  • JVM之经典垃圾回收器
  • golang context源码
  • 目标检测中的混淆矩阵
  • GitHub Copilot在产品/安全团队中的应用实践:处理Markdown、自动化报告与电子表格、使用CLI命令等
  • 音视频元素
  • 视频丨中国海警位中国黄岩岛领海及周边区域执法巡查
  • 美航母撞船后又遇战机坠海,专家:长时间作战部署疲于奔命是主因
  • 奈雪的茶叫停“能喝奶茶就不要喝水”宣传,当地市监称不要误导消费者
  • 白玉兰奖征片综述丨国产剧集创作的此消彼长
  • 美财长称关税战升级的责任在中方,外交部:关税战、贸易战没有赢家
  • 早睡1小时,变化有多惊人?第一个就没想到