当前位置: 首页 > news >正文

语音识别——通过PyAudio录入音频

PyAudio 是一个用于处理音频的 Python 库,它提供了录制和播放音频的功能。通过 PyAudio,可以轻松地从麦克风或其他音频输入设备录制音频,并将其保存为文件或进行进一步处理。

 

安装 PyAudio

在使用 PyAudio 之前,需要先安装它。可以通过以下命令安装 PyAudio:

pip install pyaudio

录制音频的基本步骤

使用 PyAudio 录制音频通常涉及以下步骤:

  1. 导入 PyAudio 库并初始化。
  2. 设置音频流的参数,如采样率、声道数和采样格式。
  3. 打开音频流并开始录制。
  4. 从音频流中读取数据并保存。
  5. 停止录制并关闭音频流。

录入音频示例代码:

import time
import sys
import sounddevice as sd
from scipy.io.wavfile import write
import numpy as npdef record_audio(filename="output.wav", sample_rate=44100):print("按下 Enter 开始录音...")input()  # 等待用户按下 Enter 键开始录音print("录音中... 按下 Enter 键结束录音")# 开始录音recording = []try:def callback(indata, frames, time, status):recording.append(indata.copy())with sd.InputStream(samplerate=sample_rate, channels=1, callback=callback):input()  # 等待用户再次按下 Enter 键结束录音except Exception as e:print(f"录音出现错误: {e}")return# 将录音数据合并并保存为 WAV 文件audio_data = np.concatenate(recording, axis=0)write(filename, sample_rate, (audio_data * 32767).astype(np.int16))print(f"录音已保存为 {filename}")# 使用函数录音,作为输入
record_audio("person_recording_1.wav",16000)
http://www.dtcms.com/a/192352.html

相关文章:

  • Linux线程控制
  • 【Pandas】pandas DataFrame eval
  • CertiK助力以太坊扩展战略,解析Pectra升级的变革与挑战
  • 5G + 区块链:技术巨浪下的新型数字生态!
  • 数字孪生工厂实战指南:基于Unreal Engine/Omniverse的虚实同步系统开发
  • 如何使用WordPress SEO检查器进行实时内容分析
  • 【OpenGL学习】(一)创建窗口
  • 边缘计算平台
  • Unity光照笔记
  • 如何使用 Google Gemini API 和 Python 从航行情报通告 (NOTAM) 中提取结构化空域信息
  • RiDoc:高效文档扫描与图像处理工具,助力高效办公
  • mavgenerate 在 win11 下环境搭建注意问题
  • Top-p采样:解锁语言模型的创意之门
  • Redis--基础知识点--27--redis缓存分类树
  • 【AI论文】用于评估和改进大型语言模型中指令跟踪的多维约束框架
  • K8S Gateway API 快速开始、胎教级教程
  • AD 区域规则(Room规则)的设置
  • Mac 环境下 JDK 版本切换全指南
  • C#中的typeof操作符与Type类型:揭秘.NET反射的基础
  • React和Vue在前端开发中, 通常选择哪一个
  • 全面指南:Xinference大模型推理框架的部署与使用
  • 6大核心记忆方法
  • datax 加密
  • Qt 安装 QtMqtt 模块
  • vue3.0的name属性插件——vite-plugin-vue-setup-extend
  • 4寸工业三防手持机PDA,助力仓储高效管理
  • Elasticsearch相关面试题
  • RHCSA 考试操作手册(基于红帽企业 Linux 8/9 版本)​
  • fpga系列 HDL : Microchip FPGA开发软件 Libero Soc 安装 license申请
  • 对心理幸福感含义的探索 | 幸福就是一切吗?