波束形成(BF)从算法仿真到工程源码实现-第七节-关于波束10个基本概念
一、波束10个基本概念
1.作用:
对多路麦克风信号进行合并处理,抑制非目标方向的干扰信号,增强目标方向的声音信号。
2.原理:
调整相位阵列的基本单元参数,使得某些角度的信号获得相长干涉,而另一些角度的信号获得相消干涉。对各个麦克风输出信号加权求和、滤波,最终输出期望方向的语音信号,相当于形成一个“波束”。
3.问题:
(1)通常的阵列处理多为窄带(300~3400Hz),没有经过调制过程,且高低频相差比较大,不同麦克风的相位延时与声源的频率关系密切,使得现有的传统窄带波束形成方法不再适用;
(2)低信噪比和混响影响的环境下难以准确估计波达方向;
(3)传统的后置滤波只考虑散射噪声或只从波束形成后的单通道输出中估计噪声。
4.技术分类:
传统的波束形成技术主要分为固定波束形成和自适应波束形成技术。
(4.1)固定波束形成:固定权重和相位设置的天线阵列技术。将主要接收波束指向特定方向,以增强来自该方向的语音信号,并尽量减小其他方向的干扰信号。这种固定的波束指向可能是根据预先定义的声源位置或期望的信号方向来确定的。固定波束形成适用于固定的语音源或需要特定传输方向的应用场景。
(4.2)自适应波束形成:根据实时接收到的语音信号和噪声环境来调整天线阵列的权重和相位设置,以提供更好的语音质量和麦克风阵列性能。它的目标是最大程度地抑制干扰噪声并增强所需的语音信号。
根据获取加权矢量时采用的方法不同,可将波束形成方法分为三类:
(1)和参考信号数据无关的波束形成方法,如常规波束形成方法,这种波束形成方法通过加权取平均得到固定的阵列输出响应,阵列输出不受信号数据变化的影响;
(2)使用最佳权矢量的波束形成方法,这类方法依赖于对阵列接收数据统计特性的估计,如最大信噪比准则;
(3)可根据接收数据变化自适应地改变权矢量的波束形成方法,如最小方差无畸变响应(MVDR)波束形成、LMS算法、递推最小二乘(RLS)算法、采样矩阵求逆(SMI)算法等。
宽带波束形成主要分为时域方法和频域方法:
(1)时域方法:对每个支路进行合适的延时,对各麦克风上接受信号的时间进行补偿,使信号到达阵列时等效为是同一波面同时到达各麦克风;
(2)频域方法:首先将宽带信号在频域分解为若干个子带,对子带信号进行窄带波束形成后,通过合成得到宽带波束输出。
由于时域方法受到采样精度的限制,多用于处理低频信号,处理高频信号更多采用频域方法。
麦克风阵列信号处理通常由自适应波束形成和后置滤波两个部分组成。
在自适应波束形成和后置滤波中,准确的估计导向矢量和噪声功率谱密度十分的关键。在导向矢量可估计的条件下,常用的波束形成算法包括延迟相加、最小方差无失真响应和广义旁瓣相消器。最简单的导向矢量估计是利用波达方向信息,除此之外,S. Gannot利用语音信号的非平稳性计算相对传递函数作为导向矢量,A. Krueger使用广义特征值分解得到的最大特征向量估计传递函数作为导向矢量。基于最小均方误差幅度谱估计和对数幅度谱估计是应用最为广泛的单通道语音增强算法之一,准确地跟踪噪声可以避免语音失真或噪声残余,常用的噪声跟踪算法有最小值跟踪算法和最小值控制递归平均算法。
5.声辐射
声音的方向性和频率有关,频率越高,方向性越强,辐射角度越小。语音是宽带信号60Hz~8kHz均有语音信息,如下图所示,不同频率信号的辐射角不一样,对波束宽度不随频率改变的波束方法(dealy-sum),波束后信号的各频率之比和波束前信号的各频率之比将会发生较大差异,从而造成一定程度的失真,影响语音的音质。
不同频率的声波辐射指向特性示意图
大多数波束形成方法的主瓣宽度有限,为了使波束在全频带上具有较强的适用性和鲁棒性,通常会对低频带和高频带做额外的处理。
6.空域混叠
时域采样为了避免频域混叠,采样率必须大于语音最高频率的两倍(奈奎斯特采样定理)。与之类似,阵列属于空域采样,为了避免空域混叠,需要满足,其中d是麦克风间距。
7.评价指标
评价波束形成器性能的指标通常有波束图、指向性因子、白噪声增益和信噪比增益四个。
(1)波束图
波束图是描述波束形成器在空间各个方向上的响应特性的图形表示。它显示了波束形成器对来自不同方向的信号的接收能力,通常用来直观展示波束形成器的指向性和分辨率。理想的波束图应该在目标方向上有一个明显的主瓣,而在其他方向上有较低的旁瓣,以减少干扰和噪声的影响。
(2)指向性因子
指向性因子是衡量波束形成器指向性的一个量化指标,它反映了波束形成器对特定方向信号的聚焦能力。指向性因子越高,表明波束形成器在目标方向上的聚焦能力越强,对非目标方向上的干扰抑制能力越好。
(3)白噪声增益
白噪声增益是指在白噪声环境下,波束形成器输出信号与输入信号的信噪比(SNR)之比。这个指标反映了波束形成器在没有色噪声(即频谱平坦的噪声)影响下的性能。白噪声增益越大,说明波束形成器在白噪声环境中的性能越好。
(4)信噪比增益
信噪比增益是指波束形成器输出信号的信噪比与输入信号的信噪比之间的比值。这个指标衡量了波束形成器在存在噪声的情况下改善信号质量的能力。信噪比增益越高,表明波束形成器在提高信号质量和抑制噪声方面的效果越好。
8.噪声场
噪声场是由噪声形成的声场。当语音信号经障碍物反射和折射会产生多个传播路径,这时声场处于“混响”状态。混响会削弱语音信号的输出,改变声场的空间特性。噪声场空间特性的改变就形成了不同类型的噪声场,根据不同噪声情况使用不同的方法进行降噪,我们可以根据噪声之间的互功率谱相关性判断是哪类噪声场。
其中是麦克风i和j的互功率谱密度,
和
分别是麦克风i和j的自功率谱密度。依据
取值的不同,噪声场分为相关噪声场(
)、非相关噪声场(
)、散射噪声场。
(1)相干噪声场:不同麦克风采集到同一噪声源发出的噪声是高度相似的,且信号的传播几乎无任何反射,常见于消声室内。由于低频信号波长较长,在日常环境中,同一噪声源发出的噪声传播到不同麦克风也是有相似性的,有时低频分量的相似性相对中高频还比较高,因此低频需要额外的处理。
(2)非相干噪声场:麦克风接收的噪声信号之间几乎不具有相关性。在麦克风阵列满足空域混叠的情况下,不同麦克风采集到的噪声完全不相干的可能性极小,但是由于麦克风属于半导体器件,而半导体器件自身产生电器噪声可以认为是完全不相关的,这类噪声通常可以设计到-65dB以下。
(3)散射噪声场:噪声在各个方向上以相等的能量同时均匀传播,这使得麦克风接收到的信号相关性较小。散射噪声场可以用sinc或bessel函数建模。
散射噪声场适用于许多场景,如:办公室、汽车内等。
9.近场与远场
以均匀线性阵列为例。假设声源S到阵列坐标中心的距离为r,任意两个相邻阵列间的间距为d,声波波长的最小值为,
,
是声速,
是周期,近场和远场模型如下图所示:
超过了这个距离就是远场,球面波变成平面波
近场模型:不同麦克风接收到的信号幅度受信号源到各麦克风距离差异影响非常明显,需考虑信号源到达不同麦克风的波程差和振幅差。声波视为球面波;
远场模型:不同麦克风接收信号的幅度差异较小,因此把不同麦克风采集的语音信号的幅值认为都是一样的,只需对各麦克风接收信号的相位差异进行处理即可。声波视为平面波。
10.SBF(超指向性波束形成)
对于麦克风阵列,最关键的问题之一是如何处理噪声环境中的有效信号捕获。信号在空间中大量的反射往往会形成接近球形的各向同性噪声场。因此,在最小无失真响应(MVDR)算法的基础上,利用各向同性散射噪声场矩阵代替MVDR算法中的噪声空间相关协方差矩阵,对语音信号做波束形成降噪处理。
所有关于波束形成算法设计的主要性能指标是各类噪声场矩阵相关函数。所谓的“超指向性”(Superdirective)是指通过最优相关函数处理,抑制来自所有方向噪声对目标信号的影响,输出比常规波束形成具有更高“方向性”的阵列增益信号,从而改善降噪处理效果。