当前位置: 首页 > news >正文

python处理音频相关的库

1  音频信号采集与播放 pyaudio

import sys
import pyaudio
import wave
import time

CHUNK = 1024
FORMAT = pyaudio.paInt16
CHANNELS = 1#仅支持单声道
RATE = 16000
RECORD_SECONDS = 3#更改录音时长

#录音函数,生成wav文件
def record(file_name):
    try:
        os.close(file_name)
        os.remove(file_name)#先删除一下文件,以防重名
    except:
        pass                  #如果文件不存在直接跳过

    p = pyaudio.PyAudio()
    stream = p.open(format=FORMAT,
                    channels=CHANNELS,
                    rate=RATE,
                    input=True,
                    frames_per_buffer=CHUNK)
    
    frames = []    
    print('录音开始')
    for i in range(0, int(RATE / CHUNK * RECORD_SECONDS)):
        data = stream.read(CHUNK)
        #print('i的数据:%s'%data)
        frames.append(data)
    print("录音结束")

    stream.stop_stream()
    stream.close()
    p.terminate()

    wf = wave.open(file_name, 'wb')
    wf.setnchannels(CHANNELS)
    wf.setsampwidth(p.get_sample_size(FORMAT))
    wf.setframerate(RATE)
    wf.writeframes(b''.join(frames))
    wf.close()

#播放函数,播放wav文件
def play(file_name):
    # 定义数据流块
    CHUNK = 1024
    # 只读方式打开wav文件
    wf = wave.open(file_name, 'rb')#(sys.argv[1], 'rb')
    p = pyaudio.PyAudio()
    # 打开数据流
    stream = p.open(format=p.get_format_from_width(wf.getsampwidth()),
                    channels=wf.getnchannels(),
                    rate=wf.getframerate(),
                    output=True)
    # 读取数据
    data = wf.readframes(CHUNK)
    # 播放
    print('试听开始')
    while data != b'':
        
        stream.write(data)
        data = wf.readframes(CHUNK)
    print('试听结束')
    # 停止数据流  
    stream.stop_stream()
    stream.close()
    # 关闭 PyAudio  
    p.terminate()

if __name__=='__main__':
    record('1.wav')
    play('1.wav')
  • record是录音,play是播放

pyaudio是我们要安装的库,这个有时不这么好装,如果pip install pyaudio不行的话,可能要下whl包或者其他方式进行安装

如果报错 OSError: [Errno -9999] Unanticipated host error 这个要检查一下麦克风,如果麦克风连接正常,你要查一下麦克风的权限

一般只有windows上会出这样的问题,在设置中搜索麦克风

回车后点击这个

这里变为开就好了

运行的显示是这样的

在录音结束后会成成 1.wav 的音频文件

这个1.wav在windows中双击打开也是可以听的

2  语音合成 pyttsx3

使用的库是pyttsx3,项目地址 GitHub - nateshmbhat/pyttsx3: Offline Text To Speech synthesis for python

我在树莓派上使用pip安装后使用会出现这个错误 OSError: libespeak.so.1: cannot open shared object file: No such file or directory

安装这个包就可以了 sudo apt-get install espeak

下面我简单摘录两个功能

2.1  播放 

import pyttsx3
pyttsx3.speak("你好")

运行后可以听到你好

2.2  保存音频文件

import pyttsx3
engine = pyttsx3.init() # object creation

"""Saving Voice to a file"""
# On linux make sure that 'espeak' and 'ffmpeg' are installed
engine.save_to_file('你好', 'test.mp3')
engine.runAndWait()

运行后会得到一个mp3文件,双击播放会听到 你好

2.3  在arm上的适配

在windows上我们直接装就行了,但是在arm上我运行上面代码得到了下面的错误

他提示没有eSpeak-ng这种东西

之后就能运行了

3  语音识别 speechrecognition与pocketsphinx

  • 参考 speechrecognition_魔天一念的博客-CSDN博客
  • 目前我只试过识别英文,链接中提到的中文包我没装

两个库都用pip install 下载就行,pocketsphinx是speechrecognition

import speech_recognition as sr

# obtain audio from the microphone
r = sr.Recognizer()
harvard = sr.AudioFile("test.wav")
with harvard as source:
    audio = r.record(source)
# recognize speech using Sphinx
try:
    result = r.recognize_sphinx(audio)
    print(result)
except sr.UnknownValueError:
    print("Sphinx could not understand audio")
except sr.RequestError as e:
    print("Sphinx error; {0}".format(e))

相关文章:

  • 【工程记录】QwQ-32b 8bit量化部署教程(vLLM | 缓解复读)
  • 2.27省选模拟赛补题记录:直径(容斥,树形dp,换根dp)
  • Java 线程池全面解析
  • vue-将组件内容导出为Word文档-docx
  • StarRocks数据导入
  • 漏洞挖掘 --- Ollama未授权访问
  • 【区块链安全 | 第三篇】主流公链以太坊运行机制
  • PAT甲级(Advanced Level) Practice 1028 List Sorting
  • 【附代码】【MILP建模】3D装箱问题(3D-Bin Packing Problem)
  • 冠珠瓷砖×郭培:当东方美学邂逅匠心工艺,高定精神如何重塑品质生活?
  • 企业在人工智能创新与安全之间走钢丝
  • TDengine 中的系统信息统计
  • oracle查询归档日志使用量
  • 阳台光伏新守护者:电流传感器助力安全发电
  • 【开源宝藏】用 JavaScript 手写一个丝滑的打字机动画效果
  • 软件确认测试注意事项和工具分享,确认测试软件测评中心有哪些?
  • 【报错】 /root/anaconda3/conda.exe: cannot execute binary file: Exec format error
  • 可变形交互注意力模块(DIA-Module)及代码详解
  • 基础场景-------------------(5)重载和重写的区别
  • Squidex:一个基于.Net功能强大的CMS开源项目
  • 小白怎么做网页/上海建站seo
  • 网站兼容手机/企业管理软件
  • 医院建网站/自助优化排名工具
  • 长宁区网站建设网站制/北京百度总部
  • 惠州做网站乐云seo/查域名
  • 免费流量网站推广/关键词优化排名详细步骤