回声消除AEC初探
1️⃣ 问题复现与根本原因
步骤 | 发生的事情 | 产生的后果 |
---|---|---|
1️⃣ 用户说话 → 麦克风捕获 | 原始语音被送给 ASR → 文本 → LLM | |
2️⃣ LLM 返回文字 | 用 TTS 把文字转换成音频 | |
3️⃣ 音频播放出来 | 扬声器 把声音放到房间里 | |
4️⃣ 麦克风仍在监听 | 播放的 TTS 声音被 再次捕获 → 进入 ASR → 产生“自说自话”或 回声/噪声 |
根本原因:
- 同一套音频链路(麦克风 → 语音识别)在 TTS 播放期间仍然打开,导致 声学回声(Acoustic Echo)。
- 回声会在 LLM 那边表现为无意义的文字