第五章:清晰篇 - 语音前端处理:从嘈杂环境中捕捉纯净人声
本章面向语音前端处理(Speech Front-End Processing),围绕噪声抑制(NS, Noise Suppression)、回声消除(AEC, Acoustic Echo Cancellation)、增益控制(AGC, Automatic Gain Control)与波束形成(BF, Beamforming)等关键模块,给出算法原理、工程实现与复现实验。我们在 PortAudio 实时采集基础上,提供 3+ 可运行示例与性能评估表,保持与前几章一致的风格与技术深度。
5.1 为何需要“清洗”声音?—— 认识环境噪声与回声的挑战
-
核心挑战
- 环境噪声(Environmental Noise):风噪、键盘声、空调噪、交通噪等导致信噪比(SNR, Signal-to-Noise Ratio)下降。
- 房间混响与回声(Reverberation & Echo):扬声器播放的远端信号通过声学路径反馈入麦克风;混响拉长语音包络、削弱瞬态。
- 麦克风阵列几何与指向性(Array Geometry & Directivity):多麦协作提升方向性(DI, Directivity Index),但需要时延补偿与权重设计。
-
数学刻画(简化视角)
- 观测信号模型:
x(t) = s(t) + n(t) + e(t)s(t):目标人声(S
- 观测信号模型:
