当前位置: 首页 > news >正文

Estimating the Number of Sources: An Efficient Maximization Approach

高效且准确地估计信源数量对于许多涉及阵列信号处理的应用至关重要。这类应用假设此参数是先验已知的,后续处理将依赖于该参数。这些算法包括:到达方向(DoA)估计 [1]、盲源分离和信道阶数分离 [2][3]。在诸如 MUSIC 或 ESPRIT 等 DoA 估计算法中,了解入射到阵列的信源数量对于通过特征值分解来分离噪声和信号子空间至关重要。DoA 估计可用于许多后续应用,包括物体定位与跟踪、在无线网络中将信号定向到期望用户,以及声音和语音处理 [1]。因此,学术界已经提出了许多检测信源数量的算法,包括:基于信息论准则的方法 [4] [5] [6]、基于特征向量的方法 [7] 以及基于阈值的估计方法 [8]。

信息准则(AIC)[5] 和最小描述长度(MDL)[6] 是最广泛使用的信源数量估计方法。这些方法是基于准则的估计算法,它们通常计算复杂,并且在样本数量少和信噪比(SNR)低的情况下性能不佳。这两种方法的复杂性问题,源于除了对观测数据的自协方差矩阵进行特征值分解(EVD)操作外,还需要通过最小化准则来搜索 AIC 或 MDL 的最小值。其性能不佳的问题,则是因为在低信噪比下,尤其是在样本数量少的情况下,对自协方差矩阵的估计不准确。这导致了用于信源数量估计的特征值之间没有明显的差异。除此之外,这类方法假设噪声与信号是不相关的,且具有类似稀疏的特性,因此在如水下 [9] 和室内办公室 [10] 等实际场景中会失效。因此,大量研究试图通过修改传统算法或提出新的估计方法来解决这些问题。

本文指出,大多数信息论方法计算复杂,而基于阈值的方法需要一个可根据不同参数重新配置的阈值。此外,几乎所有先前的工作都考虑的是自协方差矩阵的特征值,而没有考虑自相关系数矩阵的特征值,后者可以带来更简单的检测方法。

因此,本文提出了一种简单的估计算法,该算法使用自相关系数矩阵来估计特征值,并通过寻找特征值之间的最大差异或移动标准差来估计信源数量。这里的移动标准差(moving standard deviation)是指仅两个特征值的两个连续有偏标准差之间的差异。该算法在错误率方面与信息论方法在不同场景和设置下进行了比较。

II. PROBLEM FORMULATION

来自 MMM 天线阵列的接收信号的自协方差矩阵通常在估计 DoA 时被估算 [13], [14]。对于像多重信号分类(MUSIC)[15] 这样基于子空间的技术,其因在低信噪比(SNR)水平下表现出色而广为人知并被广泛使用,对 RYY\mathbf{R}_{YY}RYY 应用特征值分解(EVD)是估计 DoA 的一个步骤。换句话说,估计 RYY\mathbf{R}_{YY}RYY 及其 EVD 是大多数 DoA 估计算法中的一个常规步骤。对 RYY\mathbf{R}_{YY}RYY 应用 EVD 可得:

RYY=UYΛYUYH=UsΛsUsH+UwΛwUwH(6) \begin{aligned} \mathbf{R}_{YY} &= \mathbf{U}_Y \boldsymbol{\Lambda}_Y \mathbf{U}_Y^H \\&= \mathbf{U}_s \boldsymbol{\Lambda}_s \mathbf{U}_s^H + \mathbf{U}_w \boldsymbol{\Lambda}_w \mathbf{U}_w^H \end{aligned} \tag{6} RYY=UYΛYUYH=UsΛsUsH+UwΛwUwH(6)

其中 Us\mathbf{U}_sUsUw\mathbf{U}_wUw 分别是信号和噪声子空间的酉矩阵,而 Λs\boldsymbol{\Lambda}_sΛsΛw\boldsymbol{\Lambda}_wΛw 分别是信号和噪声特征值的对角矩阵。(6) 式可以表示为:

UYΛYUYH=diag(λ1,λ2,…,λK,0,…,0)+σ2I(7) \mathbf{U}_Y \boldsymbol{\Lambda}_Y \mathbf{U}_Y^H = \text{diag}(\lambda_1, \lambda_2, \dots, \lambda_K, 0, \dots, 0) + \sigma^2 \mathbf{I} \tag{7} UYΛYUYH=diag(λ1,λ2,,λK,0,,0)+σ2I(7)

特征值 (λ1,λ2,…,λM)(\lambda_1, \lambda_2, \dots, \lambda_M)(λ1,λ2,,λM) 及其对应的特征向量 (e1,e2,…,eM)(\mathbf{e}_1, \mathbf{e}_2, \dots, \mathbf{e}_M)(e1,e2,,eM) 定义了信号和噪声子空间,分别为 Us=[e1,…,eK]\mathbf{U}_s = [\mathbf{e}_1, \dots, \mathbf{e}_K]Us=[e1,,eK]Uw=[eK+1,…,eM]\mathbf{U}_w = [\mathbf{e}_{K+1}, \dots, \mathbf{e}_M]Uw=[eK+1,,eM]。因此,问题就变成了在给定估计的 (λ1,λ2,…,λM)(\lambda_1, \lambda_2, \dots, \lambda_M)(λ1,λ2,,λM) 的情况下,估计 KKK 的值,即入射信号的数量。

IV. EXISTING TECHNIQUES

AIC 和 MDL 是最广泛使用的信源数量估计算法。它们是基于信息论的阶数确定模型,利用样本自协方差矩阵的特征值来确定有多少个最小特征值近似相等。这些特征值将位于噪声子空间中,而其余的则位于信号子空间中。两种算法都包含最小化一个关于可检测信号数量的对数似然准则。此处不详述这些准则的推导,但两者的细节都可以在 [5] 中找到。当将特征值按降序排列时,即 λ1≥λ2≥⋯≥λM\lambda_1 \ge \lambda_2 \ge \dots \ge \lambda_Mλ1λ2λM,AIC 准则可以表示为:

KAIC=argmink(−2log⁡(∏i=k+1Mλi1M−k1M−k∑i=k+1Mλi)(M−k)N+2k(2M−k))(8) K_{AIC} = \text{argmin}_k \left( -2\log\left( \frac{\prod_{i=k+1}^M \lambda_i^{\frac{1}{M-k}}}{\frac{1}{M-k}\sum_{i=k+1}^M \lambda_i} \right)^{(M-k)N} + 2k(2M-k) \right) \tag{8} KAIC=argmink2logMk1i=k+1Mλii=k+1MλiMk1(Mk)N+2k(2Mk)(8)

而 MDL 准则可以表示为:

KMDL=argmink(−log⁡(∏i=k+1Mλi1M−k1M−k∑i=k+1Mλi)(M−k)N+12k(2M−k)log⁡(N))(9) K_{MDL} = \text{argmin}_k \left( -\log\left( \frac{\prod_{i=k+1}^M \lambda_i^{\frac{1}{M-k}}}{\frac{1}{M-k}\sum_{i=k+1}^M \lambda_i} \right)^{(M-k)N} + \frac{1}{2}k(2M-k)\log(N) \right) \tag{9} KMDL=argminklogMk1i=k+1Mλii=k+1MλiMk1(Mk)N+21k(2Mk)log(N)(9)

其中 kkk 是特征值的索引。在本文的其余部分,我们将使用 AIC 和 MDL 作为参考来比较我们提出的算法的性能。

另一种估计信源数量的方法是基于为特征值增量设置一个阈值 [16]。据观察,噪声子空间的特征值彼此接近,它们之间的差异不超过某个阈值。因此,通过将特征值的增量与一个阈值进行比较来估计信源数量。他们估计的阈值 (γinc\gamma_{inc}γinc) 由下式给出:

γinc=ρ(M,N)PS(1+PS/λM)2(10) \gamma_{inc} = \rho(M, N) \frac{P_S}{(1+\sqrt{P_S/\lambda_M})^2} \tag{10} γinc=ρ(M,N)(1+PS/λM)2PS(10)

其中 PSP_SPS 是估计的信号功率,λM\lambda_MλM 是索引为 M 的特征值,即最后一个特征值。这里的 ρ\rhoρ 是一个系数,对于每一对特定的 MMMNNN,都需要通过大量的计算机模拟来找到。换句话说,每当 NNNMMM 或两者都发生变化时,都必须预先运行一次全面的模拟来找到最佳的 ρ\rhoρ 值。

AIC 和 MDL 比基于特征值增量阈值的方法计算成本更高,因为每当需要估计信源数量时,都必须求解 (8) 和 (9) 式中给出的最小化问题。另一方面,基于特征值增量阈值的方法需要预先进行大量的迭代来相应地调整 ρ\rhoρ。除此之外,ρ\rhoρ 还依赖于诸如 NNNMMM 和 SNR 等多个参数,这使得其调整过程非常繁琐。

V. PROPOSED ALGORITHM

在我们提出的算法中,我们利用自相关系数矩阵而非自协方差矩阵来估计入射信源的数量。为了定义自相关系数矩阵,我们首先将 (6) 式中的自协方差矩阵重新定义为:

VYY=E[(Y−μY)(Y−μY)H]=ARSSAH+RWW−μYμYH(11) \mathbf{V}_{YY} = E[(\mathbf{Y}-\boldsymbol{\mu}_Y)(\mathbf{Y}-\boldsymbol{\mu}_Y)^H] = \mathbf{A}\mathbf{R}_{SS}\mathbf{A}^H + \mathbf{R}_{WW} - \boldsymbol{\mu}_Y\boldsymbol{\mu}_Y^H \tag{11} VYY=E[(YμY)(YμY)H]=ARSSAH+RWWμYμYH(11)

其中 μY=E[Y]\boldsymbol{\mu}_Y = E[\mathbf{Y}]μY=E[Y]VYY\mathbf{V}_{YY}VYY 对角线上的元素是 Y\mathbf{Y}Y 的方差。自相关系数矩阵 CYY\mathbf{C}_{YY}CYY 则由下式给出:

CYY=(diag(VYY))−12VYY(diag(VYY))−12(12) \mathbf{C}_{YY} = (\text{diag}(\mathbf{V}_{YY}))^{-\frac{1}{2}} \mathbf{V}_{YY} (\text{diag}(\mathbf{V}_{YY}))^{-\frac{1}{2}} \tag{12} CYY=(diag(VYY))21VYY(diag(VYY))21(12)

我们接着对 CYY\mathbf{C}_{YY}CYY 应用特征值分解(EVD),得到:

CYY=UCΛCUCH,UCΛCUCH=diag(λ1C,λ2C,…,λKC,0,…,0)+(diag(VYY))−12(σ2I−μYμYH)(diag(VYY))−12 \begin{align} \mathbf{C}_{YY} &= \mathbf{U}_C \boldsymbol{\Lambda}_C \mathbf{U}_C^H, \tag{13} \\ \mathbf{U}_C \boldsymbol{\Lambda}_C \mathbf{U}_C^H &= \text{diag}(\lambda_1^C, \lambda_2^C, \dots, \lambda_K^C, 0, \dots, 0) \nonumber \\ & \quad + (\text{diag}(\mathbf{V}_{YY}))^{-\frac{1}{2}} (\sigma^2\mathbf{I} - \boldsymbol{\mu}_Y\boldsymbol{\mu}_Y^H) (\text{diag}(\mathbf{V}_{YY}))^{-\frac{1}{2}} \tag{14} \end{align} CYYUCΛCUCH=UCΛCUCH,=diag(λ1C,λ2C,,λKC,0,,0)+(diag(VYY))21(σ2IμYμYH)(diag(VYY))21(13)(14)

特征值 (λ1C,λ2C,…,λMC)(\lambda_1^C, \lambda_2^C, \dots, \lambda_M^C)(λ1C,λ2C,,λMC) 及其对应的特征向量 (e1C,e2C,…,eMC)(\mathbf{e}_1^C, \mathbf{e}_2^C, \dots, \mathbf{e}_M^C)(e1C,e2C,,eMC) 定义了信号和噪声子空间,分别为 US=[e1C,…,eKC]\mathbf{U}_S = [\mathbf{e}_1^C, \dots, \mathbf{e}_K^C]US=[e1C,,eKC]UW=[eK+1C,…,eMC]\mathbf{U}_W = [\mathbf{e}_{K+1}^C, \dots, \mathbf{e}_M^C]UW=[eK+1C,,eMC]。同样,问题就变成了在给定估计的 (λ1C,λ2C,…,λMC)(\lambda_1^C, \lambda_2^C, \dots, \lambda_M^C)(λ1C,λ2C,,λMC) 的情况下估计 KKK 的值。我们首先将特征值按升序排列,而不是像 AIC 和 MDL 那样按降序排列。因此,特征值从头开始排列为 (λ1C,λ2C,…,λMC)(\lambda_1^C, \lambda_2^C, \dots, \lambda_M^C)(λ1C,λ2C,,λMC),其中 λ1C≤λ2C≤⋯≤λMC\lambda_1^C \le \lambda_2^C \le \dots \le \lambda_M^Cλ1Cλ2CλMC,并且 (λ1C,…,λM−K−1C)(\lambda_1^C, \dots, \lambda_{M-K-1}^C)(λ1C,,λMK1C) 将位于噪声子空间,而 (λM−KC,…,λMC)(\lambda_{M-K}^C, \dots, \lambda_M^C)(λMKC,,λMC) 位于信号子空间。


从 (14) 式和 (7) 式可以推断,由于信号子空间的特征值同时包含信号和噪声功率,在中高信噪比(SNR)下,信源信号特征值的值预计将高于噪声特征值。同时,噪声特征值预计彼此相当。使用自相关系数矩阵的 EVD(如 (14) 式)而不是自协方差矩阵的 EVD(如 (7) 式)的主要贡献在于,信号特征值和噪声特征值之间的差异被进一步突显,这使得信源数量的估计更加容易和高效,尤其是在低信噪比下。此外,用于估计决策统计量(进而用于决定信源数量)的数学运算可以像我们提出的移动增量或移动标准差一样简单,而不是像 (8) 和 (9) 式中给出的 AIC 和 MDL 那样复杂的决策统计量。

为了说明使用自相关系数矩阵的 EVD 相较于大多数现有技术中常规使用的自协方差矩阵的 EVD 的优势,我们绘制了在不同信噪比值(图1)和不同采集样本数(图2)下,自相关系数矩阵与自协方差矩阵的估计特征值的移动增量和移动标准差。

  • 第一个图的仿真参数为:8 天线单元阵列,2 个入射信号,1024 个样本以及不同的信噪比值。
  • 另一个图的仿真参数相同,只是信噪比固定在 -7 dB,而样本数量从 128 变为 1024。

在这里插入图片描述

从这些图中可以看出,在使用自相关系数矩阵的特征值时,决策统计量在首次从噪声子空间跃迁到信号子空间时的跳变总是最大的。之后,决策统计量开始下降;换句话说,决策统计量的最大增量总是发生在从噪声子空间移动到信号子空间时。

相反,当对自协方差矩阵的特征值使用相同的两种决策统计量时,噪声子空间和信号子空间之间的第一次跳变不一定是最大的。此外,信号子空间中的决策统计量会单调递增。这意味着,当使用自相关系数矩阵的决策统计量时,问题被转换成一个简单的最大化问题,只需搜索出现最高跳变的索引即可。而对于使用自协方差矩阵的决策统计量的情况,则需要将该决策统计量与一个阈值进行比较,以决定信源的数量。正如在 [16] 中所述(该文献在其算法中使用了协方差特征值),估计阈值是一个繁琐的过程,需要大量的模拟和迭代来为每一组特定参数估计出合适的阈值。


A. Moving Increment of the auto correlation coefficient matrix Eigenvalues

我们提出的第一个用于决定信源数量的决策统计量 (δ\deltaδ) 是移动增量。移动增量被估计为每两个连续特征值之间的差值:

δi=λiC−λi−1Cfor i=2,3,…,M.(15) \delta_i = \lambda_i^C - \lambda_{i-1}^C \quad \text{for } i=2, 3, \dots, M. \tag{15} δi=λiCλi1Cfor i=2,3,,M.(15)

最大的增量将意味着从噪声特征值到信号特征值的转变。这个转变发生的索引可以被估计为:

j=arg⁡max⁡iδi. j = \arg\max_i \delta_i. j=argimaxδi.

在这种情况下,信源数量可由 K=M−j+1K = M - j + 1K=Mj+1 给出。

B. Moving STD of the auto correlation coefficient matrix Eigenvalues

我们提出的第二个用于决定信源数量的决策统计量 (α\alphaα) 是自相关系数矩阵估计特征值的移动标准差。一般而言,有偏样本标准差是样本与其均值之间方差或差异的一种度量,它可以通过下式计算:

sM=1M∑i=1M(xi−u)2,(16) s_M = \sqrt{\frac{1}{M}\sum_{i=1}^M (x_i - u)^2}, \tag{16} sM=M1i=1M(xiu)2,(16)

其中 uuu 是均值,MMM 是样本的大小,或者在我们的情况中,是参与标准差计算的特征值的数量。

现在,求两个特征值的有偏标准差,可以通过下式完成:

STD(i)=(λiC−u)2+(λi−1C−u)2,(17) STD(i) = \sqrt{(\lambda_i^C - u)^2 + (\lambda_{i-1}^C - u)^2}, \tag{17} STD(i)=(λiCu)2+(λi1Cu)2,(17)

其中 uuu 是所涉及的两个特征值的均值,即:

u=λiC+λi−1C2.(18) u = \frac{\lambda_i^C + \lambda_{i-1}^C}{2}. \tag{18} u=2λiC+λi1C.(18)

我们将我们的第二个决策统计量,即移动 STD (α\alphaα),定义为两个连续 STD 之间的差值:

αi=(STD(i)−STD(i−1)2).for i=3,4,…,M(19) \alpha_i = \left( \frac{STD(i) - STD(i-1)}{\sqrt{2}} \right). \quad \text{for } i = 3, 4, \dots, M \tag{19} αi=(2STD(i)STD(i1)).for i=3,4,,M(19)

与使用移动增量的情况类似,噪声特征值和信号特征值之间发生转变的最高索引可以被估计为:

j=arg⁡max⁡iαi j = \arg\max_i \alpha_i j=argimaxαi

因此,信源数量可由 K=M−j+1K = M - j + 1K=Mj+1 给出。


VI. SIMULATION RESULTS

A. Algorithms Performance at Various SNR

第一个仿真是为了测试 AIC、MDL 和所提出的算法在不同信噪比(SNR)值下的性能。SNR 值的范围从 -20 到 15 dB,样本数量固定为 1024,实际信源数量为 2。

如图3所示,在低 SNR 值下,所提出的算法性能优于 MDL;在高 SNR 值下,其性能优于 AIC。在低于 -10dB 时,所提出的算法的性能与 AIC 相当,且优于 MDL。然而,在低于 -12 dB SNR 时,所有算法的估计都不准确。在这一阶段,所提出的算法估计不准确的原因是,高噪声导致特征值变化不一致,因此标准差或增量的变化是随机的,检测可能发生在不同阶段。MDL 表现不佳的原因是低估了信源数量,其检测结果也为1。在 -10 dB SNR 之后,MDL 和所提出的算法的性能变得相同,错误率几乎为0,而 AIC 的错误率则保持在10左右。AIC 未能给出更低错误率的原因是它高估了信源数量,这种情况在相对较高的 SNR 值下会发生。这种高估可能是由于 AIC 增加的惩罚项所致,正如 [17] 所证明的。


在这里插入图片描述

在任何算法设计中,需要考虑的一个重要参数是算法正确估计所需的样本数量。这对于算法的实际应用很重要,因为在这种场景下需要最小化所需的样本数量。因此,在 SNR 值为 -5 dB、存在2个入射信号的情况下,我们测试了 MDL、AIC 和所提出的算法在不同样本数量下的性能。从图4中可以看出,在样本数量较少时,所提出的算法性能优于 MDL,且与 AIC 的性能相似。在样本数量少的情况下,MDL 算法低估了信源数量,因为特征值没有很好地分布,以至于算法准则和附加的惩罚项无法检测出来。MDL 和所提出的算法在样本数量超过 256 时性能相同,错误率几乎为0。另一方面,AIC 高估了信源数量,因此其错误率为10%,这在本文进行的所有测试案例中几乎都存在。

在这里插入图片描述


C. Algorithm Performance with Different Number of Impairing Sources

不同的算法在可估计的信源数量方面可能具有不同的灵敏度。因此,在信噪比(SNR)值为 -5 dB、样本数量等于 1024 的条件下,我们测试了这些算法在不同数量的入射信源下的性能。从图5中可以看出,在可估计的最大信源数量方面,AIC 的性能优于所有其他算法。MDL 和移动 STD(标准差)算法最多可以估计 5 个信源,错误率低于 20%,但无法估计更多;而 AIC 可以估计 6 个和 7 个信源,但错误率很高。这一缺陷背后的原因是,此时 DoA(到达方向)角度之间的间隔不足以正确估计信源数量。总的来说,移动 STD 算法在使用 8 天线单元阵列时最多可以估计 6 个信号,并且无论间隔或 SNR 值如何,都无法估计更多。移动增量算法在这种配置下最多可以估计 5 个信源。然而,这种性能上的缺陷可以被安全地忽略,因为在实际的无线场景中,同时接收 6 个信源几乎是不可能的。此外,即使信源数量被正确估计,使用该估计值的后续应用(例如 DoA 估计)也无法估计超过 5 个信源,因此性能上的差异不会产生影响。

在这里插入图片描述

D. Algorithm performance with Different Array Elements

该仿真研究了增加构成阵列的单元数量所带来的影响。测试在 SNR 值为 -5、样本数量为 100 的条件下进行,有 2 个信号入射到阵列。

在这里插入图片描述

如图6所示,当单元数量增加时,错误率会下降,直到几乎为 0。对于基于移动 STD 的算法,单元数为 8 时错误率接近 0;对于 MDL 和基于移动增量的算法,则需要 12 个单元。在单元数达到 16 之前,移动 STD 算法表现出最佳性能,这可以归因于样本数量较少,导致 MDL 和移动增量算法在该阶段性能最差。在 16 个单元之后,MDL 和所提出的算法的错误率都接近 0%。

http://www.dtcms.com/a/365996.html

相关文章:

  • 上下文记忆力媲美Genie3,且问世更早:港大和可灵提出场景一致的交互式视频世界模型!
  • Guidelines for using Adaptive Platform interfaces
  • redisson功能完整指南
  • 【OpenGL】LearnOpenGL学习笔记19 - 几何着色器 Geometry Shader
  • 【机器学习深度学习】RAG边界处理策略
  • Vision Pro图像处理工具全解析
  • ClickHouse使用Docker部署
  • 刷新记录:TapData Oracle 日志同步性能达 80K TPS,重塑实时同步新标准
  • mysy2使用
  • Windows 开发环境这么难配,为什么还有那么多人在用?
  • Axure文件上传高保真交互原型:实现Web端真实上传体验
  • 机器能否真正语言?人工智能NLP面临的“理解鸿沟与突破
  • 深度学习---pytorch卷积神经网络保存和使用最优模型
  • awk相关知识
  • C++完美转发
  • 【FastDDS】Layer DDS之Domain ( 04-DomainParticipantFactory)
  • 专项智能练习(Photoshop软件基础)
  • 智能高效内存分配器测试报告
  • 【CMake】message函数
  • C++对象构造与析构
  • numpy meshgrid 转换成pygimli规则网格
  • cppreference_docs
  • 稳居全球TOP3:鹏辉能源“3+N” 布局,100Ah/50Ah等户储电芯产品筑牢市场优势
  • 【C++】Vector核心实现:类设计到迭代器陷阱
  • MySQL:表的约束上
  • C# 代码中的“熵增”概念
  • 单片机:GPIO、按键、中断、定时器、蜂鸣器
  • 《单链表经典问题全解析:5 大核心题型(移除元素 / 反转 / 找中点 / 合并 / 回文判断)实现与详解》
  • 【面试题】词汇表大小如何选择?
  • PS大神级AI建模技巧!效率翻倍工作流,悄悄收藏!