当前位置：首页 > news >正文

波束形成（BF）从算法仿真到工程源码实现-第七节-关于波束10个基本概念

news 2025/10/16 6:49:59

一、波束10个基本概念

1.作用：

对多路麦克风信号进行合并处理，抑制非目标方向的干扰信号，增强目标方向的声音信号。

2.原理：

调整相位阵列的基本单元参数，使得某些角度的信号获得相长干涉，而另一些角度的信号获得相消干涉。对各个麦克风输出信号加权求和、滤波，最终输出期望方向的语音信号，相当于形成一个“波束”。

3.问题：

（1）通常的阵列处理多为窄带(300~3400Hz)，没有经过调制过程，且高低频相差比较大，不同麦克风的相位延时与声源的频率关系密切，使得现有的传统窄带波束形成方法不再适用；

（2）低信噪比和混响影响的环境下难以准确估计波达方向；

（3）传统的后置滤波只考虑散射噪声或只从波束形成后的单通道输出中估计噪声。

4.技术分类：

传统的波束形成技术主要分为固定波束形成和自适应波束形成技术。

（4.1）固定波束形成：固定权重和相位设置的天线阵列技术。将主要接收波束指向特定方向，以增强来自该方向的语音信号，并尽量减小其他方向的干扰信号。这种固定的波束指向可能是根据预先定义的声源位置或期望的信号方向来确定的。固定波束形成适用于固定的语音源或需要特定传输方向的应用场景。

（4.2）自适应波束形成：根据实时接收到的语音信号和噪声环境来调整天线阵列的权重和相位设置，以提供更好的语音质量和麦克风阵列性能。它的目标是最大程度地抑制干扰噪声并增强所需的语音信号。

根据获取加权矢量时采用的方法不同，可将波束形成方法分为三类：

（1）和参考信号数据无关的波束形成方法，如常规波束形成方法，这种波束形成方法通过加权取平均得到固定的阵列输出响应，阵列输出不受信号数据变化的影响；

（2）使用最佳权矢量的波束形成方法，这类方法依赖于对阵列接收数据统计特性的估计，如最大信噪比准则；

（3）可根据接收数据变化自适应地改变权矢量的波束形成方法，如最小方差无畸变响应（MVDR）波束形成、LMS算法、递推最小二乘（RLS）算法、采样矩阵求逆（SMI）算法等。

宽带波束形成主要分为时域方法和频域方法：

（1）时域方法：对每个支路进行合适的延时，对各麦克风上接受信号的时间进行补偿，使信号到达阵列时等效为是同一波面同时到达各麦克风；

（2）频域方法：首先将宽带信号在频域分解为若干个子带，对子带信号进行窄带波束形成后，通过合成得到宽带波束输出。

由于时域方法受到采样精度的限制，多用于处理低频信号，处理高频信号更多采用频域方法。

麦克风阵列信号处理通常由自适应波束形成和后置滤波两个部分组成。

在自适应波束形成和后置滤波中，准确的估计导向矢量和噪声功率谱密度十分的关键。在导向矢量可估计的条件下，常用的波束形成算法包括延迟相加、最小方差无失真响应和广义旁瓣相消器。最简单的导向矢量估计是利用波达方向信息，除此之外，S. Gannot利用语音信号的非平稳性计算相对传递函数作为导向矢量，A. Krueger使用广义特征值分解得到的最大特征向量估计传递函数作为导向矢量。基于最小均方误差幅度谱估计和对数幅度谱估计是应用最为广泛的单通道语音增强算法之一，准确地跟踪噪声可以避免语音失真或噪声残余，常用的噪声跟踪算法有最小值跟踪算法和最小值控制递归平均算法。

5.声辐射

声音的方向性和频率有关，频率越高，方向性越强，辐射角度越小。语音是宽带信号60Hz~8kHz均有语音信息，如下图所示，不同频率信号的辐射角不一样，对波束宽度不随频率改变的波束方法(dealy-sum)，波束后信号的各频率之比和波束前信号的各频率之比将会发生较大差异，从而造成一定程度的失真，影响语音的音质。

不同频率的声波辐射指向特性示意图

大多数波束形成方法的主瓣宽度有限，为了使波束在全频带上具有较强的适用性和鲁棒性，通常会对低频带和高频带做额外的处理。

6.空域混叠

时域采样为了避免频域混叠，采样率必须大于语音最高频率的两倍(奈奎斯特采样定理)。与之类似，阵列属于空域采样，为了避免空域混叠，需要满足 $\frac{1}{d} \geq 2f_{max}$ ，其中d是麦克风间距。

7.评价指标

评价波束形成器性能的指标通常有波束图、指向性因子、白噪声增益和信噪比增益四个。

（1）波束图

波束图是描述波束形成器在空间各个方向上的响应特性的图形表示。它显示了波束形成器对来自不同方向的信号的接收能力，通常用来直观展示波束形成器的指向性和分辨率。理想的波束图应该在目标方向上有一个明显的主瓣，而在其他方向上有较低的旁瓣，以减少干扰和噪声的影响。

（2）指向性因子

指向性因子是衡量波束形成器指向性的一个量化指标，它反映了波束形成器对特定方向信号的聚焦能力。指向性因子越高，表明波束形成器在目标方向上的聚焦能力越强，对非目标方向上的干扰抑制能力越好。

（3）白噪声增益

白噪声增益是指在白噪声环境下，波束形成器输出信号与输入信号的信噪比（SNR）之比。这个指标反映了波束形成器在没有色噪声（即频谱平坦的噪声）影响下的性能。白噪声增益越大，说明波束形成器在白噪声环境中的性能越好。

（4）信噪比增益

信噪比增益是指波束形成器输出信号的信噪比与输入信号的信噪比之间的比值。这个指标衡量了波束形成器在存在噪声的情况下改善信号质量的能力。信噪比增益越高，表明波束形成器在提高信号质量和抑制噪声方面的效果越好。

8.噪声场

噪声场是由噪声形成的声场。当语音信号经障碍物反射和折射会产生多个传播路径，这时声场处于“混响”状态。混响会削弱语音信号的输出，改变声场的空间特性。噪声场空间特性的改变就形成了不同类型的噪声场，根据不同噪声情况使用不同的方法进行降噪，我们可以根据噪声之间的互功率谱相关性判断是哪类噪声场。

$\tau_{ij}(f)=\frac{\phi_{ij}(f)}{\sqrt{\phi_{ii}(f)\phi_{jj}(f)}}$

其中 ${\phi_{ij}(f)}$ 是麦克风i和j的互功率谱密度， $\phi_{ii}(f)$ 和 $\phi_{jj}(f)$ 分别是麦克风i和j的自功率谱密度。依据
$\tau_{ij}(f)$ 取值的不同，噪声场分为相关噪声场( $\tau_{ij}(f) \approx 1$ )、非相关噪声场( $\tau_{ij}(f)\approx 0$ )、散射噪声场。