MUSIC, Maximum Likelihood, and Cramer-Rao Bound
摘要——利用窄带传感器阵列寻找多个平面波方向的问题,以及与之相关的在噪声中估计多个叠加指数信号参数的问题,最近引起了广泛的关注。为解决这些问题,已有多种方法被提出,例如 MUSIC 算法和最大似然 (ML) 算法。
本文研究了 MUSIC 和 ML 方法的性能,并分析了它们的统计效率。本文还针对上述估计问题推导了克拉美-罗界 (CRB),并建立了 CRB 协方差矩阵的一些有用性质。此外,本文也探究了 MUSIC 和 ML 估计器之间的关系。最后,本文包含了一项数值研究,该研究探讨了在使用均匀线性阵列寻找两个平面波方向的问题中,MUSIC 估计器的统计效率。
关于本文研究结果的更精确描述可以在结论部分找到。
文章目录
- I. INTRODUCTION AND PRELIMINAR
- II. NOTATION, BASIC ASSUMPTIONS, AND SPECIAL CASES
- A. Direction Finding with Uniform Linear Sensor Arrays
- IV. THE CRAMER-RAO BOUND
- APPENDIX E DERIVATION OF THE CRB
I. INTRODUCTION AND PRELIMINAR
信号处理领域的几个重要问题,其中包括使用窄带传感器阵列进行方向探测、在噪声中估计多个叠加指数信号的参数,以及解析重叠回波(参见 [1], [2], [9], [12] 及其参考文献),都可以归结为对以下模型中的参数进行估计:
y(t)=A(θ)x(t)+e(t)t=1,2,⋯,N.(1.1a)y(t) = A(\theta)x(t) + e(t) \quad t = 1, 2, \cdots, N. \tag{1.1a} y(t)=A(θ)x(t)+e(t)t=1,2,⋯,N.(1.1a)
在 (1.1) 中,y(t)∈Cm×1y(t) \in \mathbb C^{m \times 1}y(t)∈Cm×1 是带噪声的数据向量,x(t)∈Cn×1x(t) \in \mathbb C^{n \times 1}x(t)∈Cn×1 是信号振幅向量,e(t)∈Cm×1e(t) \in \mathbb C^{m \times 1}e(t)∈Cm×1 是加性噪声,而矩阵 A(θ)∈Cm×nA(\theta) \in C^{m \times n}A(θ)∈Cm×n 具有以下特殊结构:
A(θ)=[a(ω1)⋯a(ωn)](1.1b)A(\theta) = [a(\omega_1) \cdots a(\omega_n)] \tag{1.1b} A(θ)=[a(ω1)⋯a(ωn)](1.1b)
其中 {ωi}\{\omega_i\}{ωi} 是实数参数,a(ωi)∈Cm×1a(\omega_i) \in C^{m \times 1}a(ωi)∈Cm×1 是所谓的传递向量 [在第 i 个信号和 y(t)y(t)y(t) 之间],且 θ=[ω1⋯ωn]T\theta = [\omega_1 \cdots \omega_n]^Tθ=[ω1⋯ωn]T。在第二节中,我们将简要讨论模型 (1.1) 如何涵盖上述某些应用中使用的数据模型,并将介绍关于 (1.1) 的基本假设。
II. NOTATION, BASIC ASSUMPTIONS, AND SPECIAL CASES
我们首先列出本文将使用的一些符号约定。
ATA^TAT = 矩阵 A∈Ck×pA \in \mathbb{C}^{k \times p}A∈Ck×p 的转置
A+A^+A+ = AAA 的共轭
A∗A^*A∗ = AAA 的共轭转置
Aˉ\bar{A}Aˉ = AAA 的实部
A~\tilde{A}A~ = AAA 的虚部
tr A\text{tr } Atr A = 矩阵 A∈Ck×kA \in \mathbb{C}^{k \times k}A∈Ck×k 的迹
AijA_{ij}Aij = AAA 的第 i,ji,ji,j 个元素
A⊙BA \odot BA⊙B = A∈Ck×pA \in \mathbb{C}^{k \times p}A∈Ck×p 和 B∈Ck×pB \in \mathbb{C}^{k \times p}B∈Ck×p 的哈达玛积 ([A⊙B]ij=AijBij[A \odot B]_{ij} = A_{ij}B_{ij}[A⊙B]ij=AijBij)
A≥BA \ge BA≥B = 差分矩阵 A−BA - BA−B 是半正定的,其中 AAA 和 BBB 是埃尔米特半正定矩阵
δk,p\delta_{k,p}δk,p = 狄拉克 δ\deltaδ 函数 (如果 k=pk=pk=p 则 =1=1=1,否则 =0=0=0)
ω\omegaω = 向量 θ\thetaθ 的通用元素;为避免符号复杂化,符号 ω\omegaω 和 θ\thetaθ 用于表示真实参数和未知参数
d(ω)=da(ω)/dωd(\omega) = da(\omega)/d\omegad(ω)=da(ω)/dω
EEE = 期望算子;对于确定性信号,E(⋅)=limN→∞(1/N)∑i=1N(⋅)E(\cdot) = \lim_{N\to\infty} (1/N) \sum_{i=1}^N (\cdot)E(⋅)=limN→∞(1/N)∑i=1N(⋅)
接下来,我们介绍一些关于模型 (1.1) 的基本假设。MUSIC 和 ML 方法基于不同的假设集。然而,一些假设对两种方法是共通的。共通的假设首先列出。
-
A1: m>nm > nm>n,且对应于 (n+1)(n+1)(n+1) 个不同 ω\omegaω 值的向量 a(ω)a(\omega)a(ω) 是线性无关的。(这是一个弱假设,它保证了 MUSIC 和 ML 估计器的唯一性。)
-
A2: Ee(t)=0Ee(t) = 0Ee(t)=0,Ee(t)e∗(t)=σIEe(t)e^*(t) = \sigma IEe(t)e∗(t)=σI 且 Ee(t)eT(t)=0Ee(t)e^T(t) = 0Ee(t)eT(t)=0。(这是一个更严格的假设,对 MUSIC 算法至关重要;对于 ML 方法,原则上可以放宽 A2,但这会导致相当大的复杂性。)
MUSIC 算法需要以下额外假设。
- AMU: 矩阵
P=Ex(t)x∗(t)(2.1)P = Ex(t)x^*(t) \tag{2.1} P=Ex(t)x∗(t)(2.1)
是非奇异的(正定的),且 N>mN > mN>m;而 MLE 需要以下假设:
- AML: 对于 t≠st \ne st=s,Ee(t)e∗(s)=Ee(t)eT(s)=0Ee(t)e^*(s) = Ee(t)e^T(s) = 0Ee(t)e∗(s)=Ee(t)eT(s)=0,且 e(t)e(t)e(t) 是高斯分布的。
假设 AML 似乎比 AMU 更具限制性(同样,AML 原则上可以放宽,但这会引入显著的复杂性)。上文所做的关于 MUSIC 和 MLE 使用的假设之间的区分,对于认识到这两个估计器中哪一个(如果有的话)在特定情况下可用是非常重要的(见下文)。
接下来我们简要描述通用模型 (1.1) 的一些应用。关于 (1.1) 的其他可能应用,我们参考 [9], [12] 及其中的参考文献。
A. Direction Finding with Uniform Linear Sensor Arrays
确定入射到由 mmm 个传感器组成的线性均匀窄带阵列上的 nnn 个平面波的方向的问题,可以表述为估计模型 (1.1) 的参数 θ\thetaθ 的问题,其中 x(t)x(t)x(t) 是复波幅值向量,NNN 是“快拍”数,以及
a(ω)=[1eiω⋯ei(m−1)ω]T.(2.2)a(\omega) = [1 \quad e^{i\omega} \quad \cdots \quad e^{i(m-1)\omega}]^T. \tag{2.2} a(ω)=[1eiω⋯ei(m−1)ω]T.(2.2)
请注意,在这种情况下,A(θ)A(\theta)A(θ) 是一个范德蒙矩阵,因此假设 A1 得到满足。假设 A2 和 AML 意味着噪声在空间和时间上是不相关的,而假设 AMU 意味着平面波不是“完全相干”的,并且快拍数大于阵列中的传感器数量。所有这些假设看起来都是合理的,并且可以被满足。因此,MUSIC 和 MLE 都可以在这类应用中使用。
IV. THE CRAMER-RAO BOUND
在本节中,我们假设条件 A1, A2 和 AML 成立。在这些条件下,我们推导了任意关于 θ\thetaθ 和 σ\sigmaσ 的无偏估计器的协方差矩阵的 CRB。在接下来的章节中,我们将 MUSIC 和 ML 估计器(MLE 在第五节中讨论)的性能与 CRB 对应的最终性能进行比较。当然,下文推导出的 CRB 公式的用处不仅限于本文报告的性能研究。它也可以用来确定文献中提出的其他关于 θ\thetaθ 和 σ\sigmaσ 的估计器的相对效率(例如,参见 [15]–[17], [20])。
本节的第一个结果包含在以下定理中。
定理 4.1: 在所述假设下,θ\thetaθ 和 σ\sigmaσ 的 CRB 由下式给出
CRB(θ)=σ2{∑t=1NRe[X∗(t)D∗⋅[I−A(A∗A)−1A∗]⋅DX(t)]}−1(4.1)\text{CRB}(\theta) = \frac{\sigma}{2} \left\{ \sum_{t=1}^{N} \text{Re} \left[ \mathbf{X}^*(t) \mathbf{D}^* \cdot [\mathbf{I} - \mathbf{A}(\mathbf{A}^*\mathbf{A})^{-1}\mathbf{A}^*] \cdot \mathbf{D}\mathbf{X}(t) \right] \right\}^{-1} \tag{4.1} CRB(θ)=2σ{t=1∑NRe[X∗(t)D∗⋅[I−A(A∗A)−1A∗]⋅DX(t)]}−1(4.1)
和
varCR(σ)=σ2mN(4.2)\text{var}_{\text{CR}}(\sigma) = \frac{\sigma^2}{mN} \tag{4.2} varCR(σ)=mNσ2(4.2)
其中
X(t)=[x1(t)0⋱0xn(t)]\mathbf{X}(t) = \begin{bmatrix} x_1(t) & & 0 \\ & \ddots & \\ 0 & & x_n(t) \end{bmatrix} X(t)=x1(t)0⋱0xn(t)
D=[d(ω1)⋯d(ωn)]\mathbf{D} = [d(\omega_1) \cdots d(\omega_n)] D=[d(ω1)⋯d(ωn)]
(回想一下,d(ω)=da(ω)/dωd(\omega) = da(\omega)/d\omegad(ω)=da(ω)/dω)。
证明:见附录 E。
在下文中,为方便记法,我们省略 CRB 对 θ\thetaθ 的依赖性。我们将转而强调 CRB 对 mmm 和 NNN 的依赖性。我们可以预期,当 mmm 或 NNN 增加时,CRB 会“减小”。这个直观上预期的结果确实成立,如下一个定理所示。
定理 4.2: CRB 协方差矩阵 (4.1) 满足以下次序关系:
CRB(N)≥CRB(N+1)CRB(m)≥CRB(m+1)\begin{align} \text{CRB}(N) &\ge \text{CRB}(N + 1) \tag{4.3a} \\ \text{CRB}(m) &\ge \text{CRB}(m + 1) \tag{4.3b} \end{align} CRB(N)CRB(m)≥CRB(N+1)≥CRB(m+1)(4.3a)(4.3b)
证明:见附录 F。
以上结果对于一个通用的传递向量 a(ω)a(\omega)a(ω) 是有效的。在下文中,我们为形如 (2.2) 的传递向量提供一些专门化的结果,这种形式出现在若干信号处理应用中(一些例子见第二节)。
APPENDIX E DERIVATION OF THE CRB
数据的似然函数由下式给出
L(y(1),⋯,y(N))=1(2π)mN(σ/2)mNexp{−1σ∑t=1N[y(t)−Ax(t)]∗⋅[y(t)−Ax(t)]}.L(y(1), \cdots, y(N)) = \frac{1}{(2\pi)^{mN}(\sigma/2)^{mN}} \exp \left\{ -\frac{1}{\sigma} \sum_{t=1}^{N} [y(t) - Ax(t)]^* \cdot [y(t) - Ax(t)] \right\}. L(y(1),⋯,y(N))=(2π)mN(σ/2)mN1exp{−σ1t=1∑N[y(t)−Ax(t)]∗⋅[y(t)−Ax(t)]}.
因此,对数似然函数为
lnL=const−mNlnσ−1σ∑t=1N[y∗(t)−x∗(t)A∗]⋅[y(t)−Ax(t)].(E.1)\ln L = \text{const} - mN \ln\sigma - \frac{1}{\sigma} \sum_{t=1}^{N} [y^*(t) - x^*(t)A^*] \cdot [y(t) - Ax(t)]. \tag{E.1} lnL=const−mNlnσ−σ1t=1∑N[y∗(t)−x∗(t)A∗]⋅[y(t)−Ax(t)].(E.1)
首先,我们计算 (E.1) 关于 σ\sigmaσ,{xˉ(t)≜Re x(t)}\{\bar{x}(t) \triangleq \text{Re } x(t)\}{xˉ(t)≜Re x(t)},{x~(t)≜Im x(t)}\{\tilde{x}(t) \triangleq \text{Im } x(t)\}{x~(t)≜Im x(t)} 和 θ\thetaθ 的导数。我们有
∂lnL∂σ=−mNσ+1σ2∑t=1Ne∗(t)e(t)(E.2a)\frac{\partial \ln L}{\partial \sigma} = -\frac{mN}{\sigma} + \frac{1}{\sigma^2} \sum_{t=1}^{N} e^*(t)e(t) \tag{E.2a} ∂σ∂lnL=−σmN+σ21t=1∑Ne∗(t)e(t)(E.2a)
∂lnL∂xˉ(k)=1σ[A∗e(k)+ATe+(k)]=2σRe[A∗e(k)],k=1,⋯,N(E.2b)\frac{\partial \ln L}{\partial \bar{x}(k)} = \frac{1}{\sigma} [A^*e(k) + A^Te^+(k)] = \frac{2}{\sigma} \text{Re}\,[A^*e(k)], \quad k = 1, \cdots, N \tag{E.2b} ∂xˉ(k)∂lnL=σ1[A∗e(k)+ATe+(k)]=σ2Re[A∗e(k)],k=1,⋯,N(E.2b)
∂lnL∂x~(k)=1σ[−iA∗e(k)+iATe+(k)]=2σIm[A∗e(k)],k=1,⋯,N(E.2c)\frac{\partial \ln L}{\partial \tilde{x}(k)} = \frac{1}{\sigma} [-iA^*e(k) + iA^Te^+(k)] = \frac{2}{\sigma} \text{Im}\,[A^*e(k)], \quad k = 1, \cdots, N \tag{E.2c} ∂x~(k)∂lnL=σ1[−iA∗e(k)+iATe+(k)]=σ2Im[A∗e(k)],k=1,⋯,N(E.2c)
和
∂lnL∂ωi=2σ∑t=1NRe[x∗(t)dA∗dωie(t)]=2σ∑t=1NRe[xi∗(t)d∗(ωi)e(t)],i=1,⋯,n\begin{aligned} \frac{\partial \ln L}{\partial \omega_i} &= \frac{2}{\sigma} \sum_{t=1}^{N} \text{Re}\left[x^*(t)\frac{dA^*}{d\omega_i}e(t)\right] \\ &= \frac{2}{\sigma} \sum_{t=1}^{N} \text{Re}\left[x_i^*(t)d^*(\omega_i)e(t)\right], \quad i=1,\cdots,n \end{aligned} ∂ωi∂lnL=σ2t=1∑NRe[x∗(t)dωidA∗e(t)]=σ2t=1∑NRe[xi∗(t)d∗(ωi)e(t)],i=1,⋯,n
可以更紧凑地写为
∂lnL∂θ=2σ∑t=1NRe[X∗(t)D∗e(t)].(E.2d)\frac{\partial \ln L}{\partial \theta} = \frac{2}{\sigma} \sum_{t=1}^{N} \text{Re}\left[ \mathbf{X}^*(t)\mathbf{D}^*e(t) \right]. \tag{E.2d} ∂θ∂lnL=σ2t=1∑NRe[X∗(t)D∗e(t)].(E.2d)
为了继续,我们需要一些结果。这些结果在下文中陈述和证明。
R1:
Ee∗(t)e(t)e∗(s)e(s)={m2σ2for t≠sm(m+1)σ2for t=s(E.3)Ee^*(t)e(t)e^*(s)e(s) = \begin{cases} m^2\sigma^2 & \text{for } t \ne s \\ m(m+1)\sigma^2 & \text{for } t=s \end{cases} \tag{E.3} Ee∗(t)e(t)e∗(s)e(s)={m2σ2m(m+1)σ2for t=sfor t=s(E.3)
证明:对于 t≠st \ne st=s,
Ee∗(t)e(t)e∗(s)e(s)=[EeˉT(t)eˉ(t)+Ee~T(t)e~(t)]2=m2σ2.Ee^*(t)e(t)e^*(s)e(s) = [E\bar{e}^T(t)\bar{e}(t) + E\tilde{e}^T(t)\tilde{e}(t)]^2 = m^2\sigma^2. Ee∗(t)e(t)e∗(s)e(s)=[EeˉT(t)eˉ(t)+Ee~T(t)e~(t)]2=m2σ2.
对于 t=st=st=s,
Ee∗(t)e(t)e∗(s)e(s)=E[eˉT(t)eˉ(t)+e~T(t)e~(t)]2=E[eˉT(t)eˉ(t)]2+2E[eˉT(t)eˉ(t)]E[e~T(t)e~(t)]+E[e~T(t)e~(t)]2=2E[eˉT(t)eˉ(t)]2+12m2σ2.\begin{aligned} Ee^*(t)e(t)e^*(s)e(s) &= E[\bar{e}^T(t)\bar{e}(t) + \tilde{e}^T(t)\tilde{e}(t)]^2 \\ &= E[\bar{e}^T(t)\bar{e}(t)]^2 + 2E[\bar{e}^T(t)\bar{e}(t)]E[\tilde{e}^T(t)\tilde{e}(t)] \\ & \quad + E[\tilde{e}^T(t)\tilde{e}(t)]^2 \\ &= 2E[\bar{e}^T(t)\bar{e}(t)]^2 + \frac{1}{2}m^2\sigma^2. \end{aligned} Ee∗(t)e(t)e∗(s)e(s)=E[eˉT(t)eˉ(t)+e~T(t)e~(t)]2=E[eˉT(t)eˉ(t)]2+2E[eˉT(t)eˉ(t)]E[e~T(t)e~(t)]+E[e~T(t)e~(t)]2=2E[eˉT(t)eˉ(t)]2+21m2σ2.
由于
E[eˉT(t)eˉ(t)]2=E∑i=1m∑j=1meˉi2(t)eˉj2(t)=∑i=1m∑j=1,j≠imEeˉi2(t)Eeˉj2(t)+∑i=1mEeˉi4(t)=(m−1)mσ24+3mσ24=m(m+2)σ24,\begin{aligned} E[\bar{e}^T(t)\bar{e}(t)]^2 &= E \sum_{i=1}^m \sum_{j=1}^m \bar{e}_i^2(t)\bar{e}_j^2(t) = \sum_{i=1}^m \sum_{j=1, j\ne i}^m E\bar{e}_i^2(t)E\bar{e}_j^2(t) \\ & \quad + \sum_{i=1}^m E\bar{e}_i^4(t) \\ &= (m-1)m\frac{\sigma^2}{4} + 3m\frac{\sigma^2}{4} = m(m+2)\frac{\sigma^2}{4}, \end{aligned} E[eˉT(t)eˉ(t)]2=Ei=1∑mj=1∑meˉi2(t)eˉj2(t)=i=1∑mj=1,j=i∑mEeˉi2(t)Eeˉj2(t)+i=1∑mEeˉi4(t)=(m−1)m4σ2+3m4σ2=m(m+2)4σ2,
2[m(m+2)σ24]+12m2σ2=m(m+2)σ22+m2σ22=(m2+2m+m2)σ22=(2m2+2m)σ22=m(m+1)σ2\begin{aligned} & 2\left[m(m+2) \frac{\sigma^{2}}{4}\right]+\frac{1}{2} m^{2} \sigma^{2}=m(m+2) \frac{\sigma^{2}}{2}+\frac{m^{2} \sigma^{2}}{2} \\ = & \frac{\left(m^{2}+2 m+m^{2}\right) \sigma^{2}}{2}=\frac{\left(2 m^{2}+2 m\right) \sigma^{2}}{2}=m(m+1) \sigma^{2} \end{aligned}=2[m(m+2)4σ2]+21m2σ2=m(m+2)2σ2+2m2σ22(m2+2m+m2)σ2=2(2m2+2m)σ2=m(m+1)σ2
证明完毕。
R2:
Ee∗(t)e(t)eT(s)=0for all tand s.(E.4)Ee^*(t)e(t)e^T(s) = 0 \quad \text{for all } t \text{ and } s. \tag{E.4} Ee∗(t)e(t)eT(s)=0for all t and s.(E.4)
证明:对于 t≠st \ne st=s,由于 e(t)e(t)e(t) 和 e(s)e(s)e(s) 是独立的,结果是显而易见的。对于 t=st=st=s,该结论可由高斯随机变量的三阶矩等于零这一事实得出。
R3:
Re(x)Re(yT)=12[Re(xyT)+Re(xy∗)]Im(x)Im(yT)=−12[Re(xyT)−Re(xy∗)]Re(x)Im(yT)=12[Im(xyT)−Im(xy∗)].(E.5)\begin{aligned} \text{Re}\,(x) \text{Re}\,(y^T) &= \frac{1}{2}[\text{Re}\,(xy^T) + \text{Re}\,(xy^*)] \\ \text{Im}\,(x) \text{Im}\,(y^T) &= -\frac{1}{2}[\text{Re}\,(xy^T) - \text{Re}\,(xy^*)] \\ \text{Re}\,(x) \text{Im}\,(y^T) &= \frac{1}{2}[\text{Im}\,(xy^T) - \text{Im}\,(xy^*)]. \end{aligned} \tag{E.5} Re(x)Re(yT)Im(x)Im(yT)Re(x)Im(yT)=21[Re(xyT)+Re(xy∗)]=−21[Re(xyT)−Re(xy∗)]=21[Im(xyT)−Im(xy∗)].(E.5)
证明:该结果可由一些直接的计算得出。
R4: 设 H\mathbf{H}H 是一个非奇异复矩阵,并将其逆记为 G≜H−1\mathbf{G} \triangleq \mathbf{H}^{-1}G≜H−1。则
[Hˉ−H~H~Hˉ]−1=[Gˉ−G~G~Gˉ].(E.6)\begin{bmatrix} \bar{\mathbf{H}} & -\tilde{\mathbf{H}} \\ \tilde{\mathbf{H}} & \bar{\mathbf{H}} \end{bmatrix}^{-1} = \begin{bmatrix} \bar{\mathbf{G}} & -\tilde{\mathbf{G}} \\ \tilde{\mathbf{G}} & \bar{\mathbf{G}} \end{bmatrix}. \tag{E.6} [HˉH~−H~Hˉ]−1=[GˉG~−G~Gˉ].(E.6)
证明:
[H‾−H~H~H‾][G‾−G~G~G‾]=[H‾G‾−H~G~−(H‾G~+H~G‾)H~G‾+H‾G~H‾G‾−H~G~]\left[\begin{array}{cc} \overline{\mathbf{H}} & -\tilde{\mathbf{H}} \\ \tilde{\mathbf{H}} & \overline{\mathbf{H}} \end{array}\right]\left[\begin{array}{cc} \overline{\mathbf{G}} & -\tilde{\mathbf{G}} \\ \tilde{\mathbf{G}} & \overline{\mathbf{G}} \end{array}\right]=\left[\begin{array}{lc} \overline{\mathbf{H}} \overline{\mathbf{G}}-\tilde{\mathbf{H}} \tilde{\mathbf{G}} & -(\overline{\mathbf{H}} \tilde{\mathbf{G}}+\tilde{\mathbf{H}} \overline{\mathbf{G}}) \\ \tilde{\mathbf{H}} \overline{\mathbf{G}}+\overline{\mathbf{H}} \tilde{\mathbf{G}} & \overline{\mathbf{H}} \overline{\mathbf{G}}-\tilde{\mathbf{H}} \tilde{\mathbf{G}} \end{array}\right][HH~−H~H][GG~−G~G]=[HG−H~G~H~G+HG~−(HG~+H~G)HG−H~G~]
等式 (E.6) 可以等价地写为
HˉGˉ−H~G~=IHˉG~+H~Gˉ=0\begin{aligned} \bar{\mathbf{H}}\bar{\mathbf{G}} - \tilde{\mathbf{H}}\tilde{\mathbf{G}} &= \mathbf{I} \\ \bar{\mathbf{H}}\tilde{\mathbf{G}} + \tilde{\mathbf{H}}\bar{\mathbf{G}} &= \mathbf{0} \end{aligned} HˉGˉ−H~G~HˉG~+H~Gˉ=I=0
这当然必须成立,因为
I=HG=(Hˉ+iH~)(Gˉ+iG~)=(HˉGˉ−H~G~)+i(HˉG~+H~Gˉ).\begin{aligned} \mathbf{I} = \mathbf{H}\mathbf{G} &= (\bar{\mathbf{H}} + i\tilde{\mathbf{H}})(\bar{\mathbf{G}} + i\tilde{\mathbf{G}}) \\ &= (\bar{\mathbf{H}}\bar{\mathbf{G}} - \tilde{\mathbf{H}}\tilde{\mathbf{G}}) + i(\bar{\mathbf{H}}\tilde{\mathbf{G}} + \tilde{\mathbf{H}}\bar{\mathbf{G}}). \end{aligned} I=HG=(Hˉ+iH~)(Gˉ+iG~)=(HˉGˉ−H~G~)+i(HˉG~+H~Gˉ).
现在转向 CRB 协方差矩阵的评估,它由下式给出
Ω=(EΨΨT)−1(E.7a)\boldsymbol{\Omega} = (E\boldsymbol{\Psi}\boldsymbol{\Psi}^T)^{-1} \tag{E.7a} Ω=(EΨΨT)−1(E.7a)
其中
ΨT≜∂lnL/∂[σxˉT(1)x~T(1)⋯xˉT(N)x~T(N)θT].(E.7b)\boldsymbol{\Psi}^T \triangleq \partial\ln L / \partial[\sigma\,\bar{\mathbf{x}}^T(1)\,\tilde{\mathbf{x}}^T(1)\,\cdots\,\bar{\mathbf{x}}^T(N)\,\tilde{\mathbf{x}}^T(N)\,\boldsymbol{\theta}^T]. \tag{E.7b} ΨT≜∂lnL/∂[σxˉT(1)x~T(1)⋯xˉT(N)x~T(N)θT].(E.7b)
使用 R1,我们得到
E∣∂lnL∂σ∣2=m2N2σ2−2mNσ3∑t=1NEe∗(t)e(t)+1σ4∑t=1N∑s=1NEe∗(t)e(t)e∗(s)e(s)=m2N2σ2−2m2N2σ2+Nmσ2[(N−1)m+(m+1)]=mNσ2.(E.8a)\begin{aligned} E\left|\frac{\partial \ln L}{\partial \sigma}\right|^2 &= \frac{m^2N^2}{\sigma^2} - 2\frac{mN}{\sigma^3}\sum_{t=1}^N Ee^*(t)e(t) \\ & \quad + \frac{1}{\sigma^4}\sum_{t=1}^N\sum_{s=1}^N Ee^*(t)e(t)e^*(s)e(s) \\ &= \frac{m^2N^2}{\sigma^2} - 2\frac{m^2N^2}{\sigma^2} \\ & \quad + \frac{Nm}{\sigma^2}[(N-1)m + (m+1)] \\ &= \frac{mN}{\sigma^2}. \end{aligned} \tag{E.8a} E∂σ∂lnL2=σ2m2N2−2σ3mNt=1∑NEe∗(t)e(t)+σ41t=1∑Ns=1∑NEe∗(t)e(t)e∗(s)e(s)=σ2m2N2−2σ2m2N2+σ2Nm[(N−1)m+(m+1)]=σ2mN.(E.8a)
使用 R2,我们注意到 ∂lnL/∂σ\partial \ln L / \partial \sigma∂lnL/∂σ 与 (E.2) 中的任何其他导数都不相关。
接下来,我们使用 R3 以及 Ee(t)eT(s)=0Ee(t)e^T(s)=0Ee(t)eT(s)=0 这一事实
E[∂lnL∂xˉ(k)][∂lnL∂xˉ(p)]T=4σ212Re[EA∗e(k)e∗(p)A]=2σRe[A∗A]δk,p(E.8b)\begin{aligned} E\left[\frac{\partial \ln L}{\partial \bar{\mathbf{x}}(k)}\right]\left[\frac{\partial \ln L}{\partial \bar{\mathbf{x}}(p)}\right]^T &= \frac{4}{\sigma^2}\frac{1}{2}\text{Re}\,[E\mathbf{A}^*e(k)e^*(p)\mathbf{A}] \\ &= \frac{2}{\sigma}\text{Re}\,[\mathbf{A}^*\mathbf{A}]\delta_{k,p} \end{aligned} \tag{E.8b} E[∂xˉ(k)∂lnL][∂xˉ(p)∂lnL]T=σ2421Re[EA∗e(k)e∗(p)A]=σ2Re[A∗A]δk,p(E.8b)
E[∂lnL∂xˉ(k)][∂lnL∂x~(p)]T=−4σ212Im[EA∗e(k)e∗(p)A]=−2σIm[A∗A]δk,p(E.8c)\begin{aligned} E\left[\frac{\partial \ln L}{\partial \bar{\mathbf{x}}(k)}\right]\left[\frac{\partial \ln L}{\partial \tilde{\mathbf{x}}(p)}\right]^T &= -\frac{4}{\sigma^2}\frac{1}{2}\text{Im}\,[E\mathbf{A}^*e(k)e^*(p)\mathbf{A}] \\ &= -\frac{2}{\sigma}\text{Im}\,[\mathbf{A}^*\mathbf{A}]\delta_{k,p} \end{aligned} \tag{E.8c} E[∂xˉ(k)∂lnL][∂x~(p)∂lnL]T=−σ2421Im[EA∗e(k)e∗(p)A]=−σ2Im[A∗A]δk,p(E.8c)
E[∂lnL∂xˉ(k)][∂lnL∂θ]T=4σ2∑t=1N12⋅Re[EA∗e(k)e∗(t)DX(t)]=2σRe[A∗DX(k)](E.8d)\begin{aligned} E\left[\frac{\partial \ln L}{\partial \bar{\mathbf{x}}(k)}\right]\left[\frac{\partial \ln L}{\partial \boldsymbol{\theta}}\right]^T &= \frac{4}{\sigma^2}\sum_{t=1}^N\frac{1}{2} \cdot \text{Re}\,[E\mathbf{A}^*e(k)e^*(t)\mathbf{D}\mathbf{X}(t)] \\ &= \frac{2}{\sigma}\text{Re}\,[\mathbf{A}^*\mathbf{D}\mathbf{X}(k)] \end{aligned} \tag{E.8d} E[∂xˉ(k)∂lnL][∂θ∂lnL]T=σ24t=1∑N21⋅Re[EA∗e(k)e∗(t)DX(t)]=σ2Re[A∗DX(k)](E.8d)
E[∂lnL∂x~(k)][∂lnL∂x~(p)]T=4σ212Re[EA∗e(k)e∗(p)A]=2σRe[A∗A]δk,p(E.8e)\begin{aligned} E\left[\frac{\partial \ln L}{\partial \tilde{\mathbf{x}}(k)}\right]\left[\frac{\partial \ln L}{\partial \tilde{\mathbf{x}}(p)}\right]^T &= \frac{4}{\sigma^2}\frac{1}{2}\text{Re}\,[E\mathbf{A}^*e(k)e^*(p)\mathbf{A}] \\ &= \frac{2}{\sigma}\text{Re}\,[\mathbf{A}^*\mathbf{A}]\delta_{k,p} \end{aligned} \tag{E.8e} E[∂x~(k)∂lnL][∂x~(p)∂lnL]T=σ2421Re[EA∗e(k)e∗(p)A]=σ2Re[A∗A]δk,p(E.8e)
E[∂lnL∂x~(k)][∂lnL∂θ]T=4σ2∑t=1N(−12)⋅Im[EX∗(t)D∗e(t)e∗(k)A]T=−2σIm[X∗(k)D∗A]T=2σIm[A∗DX(k)](E.8f)\begin{aligned} E\left[\frac{\partial \ln L}{\partial \tilde{\mathbf{x}}(k)}\right]\left[\frac{\partial \ln L}{\partial \boldsymbol{\theta}}\right]^T &= \frac{4}{\sigma^2}\sum_{t=1}^N\left(-\frac{1}{2}\right) \cdot \text{Im}\,[E\mathbf{X}^*(t)\mathbf{D}^*e(t)e^*(k)\mathbf{A}]^T \\ &= -\frac{2}{\sigma}\text{Im}\,[\mathbf{X}^*(k)\mathbf{D}^*\mathbf{A}]^T \\ &= \frac{2}{\sigma}\text{Im}\,[\mathbf{A}^*\mathbf{D}\mathbf{X}(k)] \end{aligned} \tag{E.8f} E[∂x~(k)∂lnL][∂θ∂lnL]T=σ24t=1∑N(−21)⋅Im[EX∗(t)D∗e(t)e∗(k)A]T=−σ2Im[X∗(k)D∗A]T=σ2Im[A∗DX(k)](E.8f)
E[∂lnL∂θ][∂lnL∂θ]T=4σ212∑t=1N∑s=1NRe[EX∗(t)D∗e(t)e∗(s)DX(s)]=2σ∑t=1NRe[X∗(t)D∗DX(t)]≜Γ.(E.8g)\begin{aligned} E\left[\frac{\partial \ln L}{\partial \boldsymbol{\theta}}\right]\left[\frac{\partial \ln L}{\partial \boldsymbol{\theta}}\right]^T &= \frac{4}{\sigma^2}\frac{1}{2}\sum_{t=1}^N\sum_{s=1}^N \text{Re}\,[E\mathbf{X}^*(t)\mathbf{D}^*e(t)e^*(s)\mathbf{D}\mathbf{X}(s)] \\ &= \frac{2}{\sigma}\sum_{t=1}^N \text{Re}\,[\mathbf{X}^*(t)\mathbf{D}^*\mathbf{D}\mathbf{X}(t)] \triangleq \mathbf{\Gamma}. \end{aligned} \tag{E.8g} E[∂θ∂lnL][∂θ∂lnL]T=σ2421t=1∑Ns=1∑NRe[EX∗(t)D∗e(t)e∗(s)DX(s)]=σ2t=1∑NRe[X∗(t)D∗DX(t)]≜Γ.(E.8g)
引入以下记法:
varCR(σ)=σ2/mN\text{var}_{\text{CR}}(\sigma) = \sigma^2/mN varCR(σ)=σ2/mN
H=2σA∗A\mathbf{H} = \frac{2}{\sigma}\mathbf{A}^*\mathbf{A} H=σ2A∗A
G=H−1\mathbf{G} = \mathbf{H}^{-1} G=H−1
Δk=2σA∗DX(k).\boldsymbol{\Delta}_k = \frac{2}{\sigma}\mathbf{A}^*\mathbf{D}\mathbf{X}(k). Δk=σ2A∗DX(k).
注意到由于矩阵 H\mathbf{H}H 是埃尔米特矩阵,其虚部必须是斜对称的,即 H~T=−H~\tilde{\mathbf{H}}^T = -\tilde{\mathbf{H}}H~T=−H~。将 (E.8) 代入 (E.7) 并使用上述记法,我们得到
Ω=[varCR−1(σ)0Hˉ−H~H~Hˉ0Δˉ1Δ~100⋱⋮Hˉ−H~H~HˉΔˉNΔ~NΔˉ1TΔ~1T⋯ΔˉNTΔ~NTΓ]−1(E.9)\boldsymbol{\Omega} = \begin{bmatrix} \text{var}_{\text{CR}}^{-1}(\sigma) & 0 & & & \\ & \begin{matrix} \bar{\mathbf{H}} & -\tilde{\mathbf{H}} \\ \tilde{\mathbf{H}} & \bar{\mathbf{H}} \end{matrix} & 0 & & \begin{matrix} \bar{\boldsymbol{\Delta}}_1 \\ \tilde{\boldsymbol{\Delta}}_1 \end{matrix} \\ 0 & 0 & \ddots & & \vdots \\ & & & \begin{matrix} \bar{\mathbf{H}} & -\tilde{\mathbf{H}} \\ \tilde{\mathbf{H}} & \bar{\mathbf{H}} \end{matrix} & \begin{matrix} \bar{\boldsymbol{\Delta}}_N \\ \tilde{\boldsymbol{\Delta}}_N \end{matrix} \\ & \begin{matrix} \bar{\boldsymbol{\Delta}}_1^T & \tilde{\boldsymbol{\Delta}}_1^T \end{matrix} & \cdots & \begin{matrix} \bar{\boldsymbol{\Delta}}_N^T & \tilde{\boldsymbol{\Delta}}_N^T \end{matrix} & \mathbf{\Gamma} \end{bmatrix}^{-1} \tag{E.9} Ω=varCR−1(σ)00HˉH~−H~Hˉ0Δˉ1TΔ~1T0⋱⋯HˉH~−H~HˉΔˉNTΔ~NTΔˉ1Δ~1⋮ΔˉNΔ~NΓ−1(E.9)
因此,关于 varCR(σ)\text{var}_{\text{CR}}(\sigma)varCR(σ) 的表达式 (4.2) 得证。为证明关于 CRB(θ)\text{CRB}(\theta)CRB(θ) 的表达式 (4.1),我们注意到 (E.9),一个关于分块矩阵求逆的标准结果,以及 R4 给出了
CRB−1(θ)=Γ−[Δˉ1TΔ~1T⋯ΔˉNTΔ~NT][Gˉ−G~G~Gˉ0⋱0Gˉ−G~G~Gˉ][Δˉ1Δ~1⋮ΔˉNΔ~N](E.10)\text{CRB}^{-1}(\theta) = \mathbf{\Gamma} - \begin{bmatrix} \bar{\boldsymbol{\Delta}}_1^T & \tilde{\boldsymbol{\Delta}}_1^T & \cdots & \bar{\boldsymbol{\Delta}}_N^T & \tilde{\boldsymbol{\Delta}}_N^T \end{bmatrix} \begin{bmatrix} \begin{matrix} \bar{\mathbf{G}} & -\tilde{\mathbf{G}} \\ \tilde{\mathbf{G}} & \bar{\mathbf{G}} \end{matrix} & & \mathbf{0} \\ & \ddots & \\ \mathbf{0} & & \begin{matrix} \bar{\mathbf{G}} & -\tilde{\mathbf{G}} \\ \tilde{\mathbf{G}} & \bar{\mathbf{G}} \end{matrix} \end{bmatrix} \begin{bmatrix} \bar{\boldsymbol{\Delta}}_1 \\ \tilde{\boldsymbol{\Delta}}_1 \\ \vdots \\ \bar{\boldsymbol{\Delta}}_N \\ \tilde{\boldsymbol{\Delta}}_N \end{bmatrix} \tag{E.10} CRB−1(θ)=Γ−[Δˉ1TΔ~1T⋯ΔˉNTΔ~NT]GˉG~−G~Gˉ0⋱0GˉG~−G~GˉΔˉ1Δ~1⋮ΔˉNΔ~N(E.10)
接下来,观察到
[Gˉ−G~G~Gˉ][ΔˉΔ~]=[GˉΔˉ−G~Δ~G~Δˉ+GˉΔ~]=[GΔ‾GΔ~](E.11a)\begin{bmatrix} \bar{\mathbf{G}} & -\tilde{\mathbf{G}} \\ \tilde{\mathbf{G}} & \bar{\mathbf{G}} \end{bmatrix} \begin{bmatrix} \bar{\boldsymbol{\Delta}} \\ \tilde{\boldsymbol{\Delta}} \end{bmatrix} = \begin{bmatrix} \bar{\mathbf{G}}\bar{\boldsymbol{\Delta}} - \tilde{\mathbf{G}}\tilde{\boldsymbol{\Delta}} \\ \tilde{\mathbf{G}}\bar{\boldsymbol{\Delta}} + \bar{\mathbf{G}}\tilde{\boldsymbol{\Delta}} \end{bmatrix} = \begin{bmatrix} \overline{\mathbf{G}\boldsymbol{\Delta}} \\ \widetilde{\mathbf{G}\boldsymbol{\Delta}} \end{bmatrix} \tag{E.11a} [GˉG~−G~Gˉ][ΔˉΔ~]=[GˉΔˉ−G~Δ~G~Δˉ+GˉΔ~]=[GΔGΔ](E.11a)
并且
[ΔˉTΔ~T][GΔ‾GΔ~]=Re[Δ∗GΔ].(E.11b)\begin{bmatrix} \bar{\boldsymbol{\Delta}}^T & \tilde{\boldsymbol{\Delta}}^T \end{bmatrix} \begin{bmatrix} \overline{\mathbf{G}\boldsymbol{\Delta}} \\ \widetilde{\mathbf{G}\boldsymbol{\Delta}} \end{bmatrix} = \text{Re}\,[\boldsymbol{\Delta}^*\mathbf{G}\boldsymbol{\Delta}]. \tag{E.11b} [ΔˉTΔ~T][GΔGΔ]=Re[Δ∗GΔ].(E.11b)
由 (E.10) 和 (E.11) 可得
CRB−1(θ)=Γ−∑t=1NRe[Δt∗GΔt]=2σ∑t=1NRe[X∗(t)D∗DX(t)−X∗(t)D∗A(A∗A)−1A∗DX(t)]=2σ∑t=1NRe{X∗(t)D∗[I−A(A∗A)−1A∗]DX(t)}\begin{aligned} \text{CRB}^{-1}(\theta) &= \mathbf{\Gamma} - \sum_{t=1}^N \text{Re}\,[\boldsymbol{\Delta}_t^*\mathbf{G}\boldsymbol{\Delta}_t] = \frac{2}{\sigma}\sum_{t=1}^N \text{Re}\,[\mathbf{X}^*(t)\mathbf{D}^*\mathbf{D}\mathbf{X}(t) \\ & \quad - \mathbf{X}^*(t)\mathbf{D}^*\mathbf{A}(\mathbf{A}^*\mathbf{A})^{-1}\mathbf{A}^*\mathbf{D}\mathbf{X}(t)] \\ &= \frac{2}{\sigma}\sum_{t=1}^N \text{Re}\,\left\{\mathbf{X}^*(t)\mathbf{D}^*[\mathbf{I} - \mathbf{A}(\mathbf{A}^*\mathbf{A})^{-1}\mathbf{A}^*]\mathbf{D}\mathbf{X}(t)\right\} \end{aligned} CRB−1(θ)=Γ−t=1∑NRe[Δt∗GΔt]=σ2t=1∑NRe[X∗(t)D∗DX(t)−X∗(t)D∗A(A∗A)−1A∗DX(t)]=σ2t=1∑NRe{X∗(t)D∗[I−A(A∗A)−1A∗]DX(t)}
证明完毕。