广义矩估计错误指定时的一个推导【续5】
定理1 作者的证明
在证明定理1、2和3时,我们使用以下结果。在假设1,2,4−61,2,4 - 61,2,4−6 和假设A.1-A.6的基础上,依据标准论证(例如,Newey 和 McFadden(1994,第2.1定理)以及 Wooldridge(1994,第7.1定理))得出
θ^T→pθ∗.(A.6) {\widehat{\theta }}_{T}\overset{\mathrm{p}}{ \rightarrow }{\theta }_{ * }. \tag{A.6} θT→pθ∗.(A.6)
其中 θ∗{\theta }_{ * }θ∗ 由假设5定义,适用于合适的 WWW 。
由假设1、4-6、假设A.1-A.9以及式(A.6)可得
Ip−H0,TMT→pIp+(G∗′WG∗)−1(μ∗′W⊗Ip)G∗(2))=(G∗′WG∗)−1H∗. \left. {{I}_{p} - {H}_{0, T}{M}_{T}\overset{\mathrm{p}}{ \rightarrow }{I}_{p} + {\left( {G}_{ * }^{\prime }W{G}_{ * }\right) }^{-1}\left( {{\mu }_{ * }^{\prime }W \otimes {I}_{p}}\right) {G}_{ * }^{\left( 2\right) }}\right) = {\left( {G}_{ * }^{\prime }W{G}_{ * }\right) }^{-1}{H}_{ * }. Ip−H0,TMT→pIp+(G∗′WG∗)−1(μ∗′W⊗Ip)G∗(2))=(G∗′WG∗)−1H∗.
因此,根据假设7,我们有
(Ip−H0,TMT)−1H0,T→p−H∗−1.(A.7) {\left( {I}_{p} - {H}_{0, T}{M}_{T}\right) }^{-1}{H}_{0, T}\overset{\mathrm{p}}{ \rightarrow } - {H}_{ * }^{-1}. \tag{A.7} (Ip−H0,TMT)−1H0,T→p−H∗−1.(A.7)
定理1的证明。设cT=T1/2{c}_{T} = {T}^{1/2}cT=T1/2。根据假设1、2、4-5、假设A.1-A.3、A.5-A.6、A.8-A.9、定理的条件以及WT=W{W}_{T} = WWT=W,可以得出
H1,T+H2,T(2)+H2,T(3)=H1,T+H2,T(2)+op(1) {H}_{1, T} + {H}_{2, T}\left( 2\right) + {H}_{2, T}\left( 3\right) = {H}_{1, T} + {H}_{2, T}\left( 2\right) + {\mathrm{o}}_{\mathrm{p}}\left( 1\right) H1,T+H2,T(2)+H2,T(3)=H1,T+H2,T(2)+op(1)
→dN(0,G∗′WΩ11WG∗+G∗′WΩ12+Ω21WG∗+Ω22). \overset{\mathrm{d}}{ \rightarrow }\mathrm{N}\left( {0,{G}_{ * }^{\prime }W{\Omega }_{11}W{G}_{ * } + {G}_{ * }^{\prime }W{\Omega }_{12} + {\Omega }_{21}W{G}_{ * } + {\Omega }_{22}}\right) . →dN(0,G∗′WΩ11WG∗+G∗′WΩ12+Ω21WG∗+Ω22).
(A.8)
因此,所需的结论由(32)和(33)推导而出。
我们按照作者的证明给出具体的形式
定理1的证明(遵循作者思路)
已知条件:
- WT=WW_T = WWT=W (固定加权矩阵)
- 假设1-5及假设A.1-A.10成立
- θ^T→pθ∗\hat{\theta}_T \overset{p}{\to} \theta_*θ^T→pθ∗ (由A.6式)
- (Ip−H0,TMT)−1H0,T→p−H∗−1(I_p - H_{0,T} M_T)^{-1} H_{0,T} \overset{p}{\to} -H_*^{-1}(Ip−H0,TMT)−1H0,T→p−H∗−1 (由A.7式)
证明步骤:
第1步:利用公式(9)作为起点
从之前推导得到的一般形式公式(9)出发:
cT(θ^T−θ∗)=[Ip−H0,TMT]−1H0,T{H1,T+H2,T(2)+H2,T(3)}
c_T (\hat{\theta}_T - \theta_*) = [I_p - H_{0,T} M_T]^{-1} H_{0,T} \{ H_{1,T} + H_{2,T}(2) + H_{2,T}(3) \}
cT(θ^T−θ∗)=[Ip−H0,TMT]−1H0,T{H1,T+H2,T(2)+H2,T(3)}
其中 cT=T1/2c_T = T^{1/2}cT=T1/2。
第2步:应用本定理的特殊条件 (WT=WW_T = WWT=W)
由于 WT=WW_T = WWT=W 是固定矩阵,因此:
WT−W=0⇒H2,T(3)=G∗′cT(WT−W)μ∗=0
W_T - W = 0 \Rightarrow H_{2,T}(3) = G_*' c_T (W_T - W) \mu_* = 0
WT−W=0⇒H2,T(3)=G∗′cT(WT−W)μ∗=0
所以:
H1,T+H2,T(2)+H2,T(3)=H1,T+H2,T(2)+op(1)
H_{1,T} + H_{2,T}(2) + H_{2,T}(3) = H_{1,T} + H_{2,T}(2) + o_p(1)
H1,T+H2,T(2)+H2,T(3)=H1,T+H2,T(2)+op(1)
第3步:确定 H1,T+H2,T(2)H_{1,T} + H_{2,T}(2)H1,T+H2,T(2) 的渐近分布
由假设A.1-A.10,我们有以下联合渐近正态性:
[T−1/2∑t=1T(f(vt,θ∗)−μ∗)T1/2[GT(θ∗)−G∗]′Wμ∗]→dN(0,[Ω11Ω12Ω21Ω22])(10)
\left[ \begin{matrix}
T^{-1/2} \sum_{t=1}^T (f(v_t, \theta_*) - \mu_*) \\
T^{1/2} [G_T(\theta_*) - G_*]' W \mu_*
\end{matrix} \right]
\overset{d}{\to} N \left( 0,
\left[ \begin{matrix}
\Omega_{11} & \Omega_{12} \\
\Omega_{21} & \Omega_{22}
\end{matrix} \right]
\right) \tag{10}
[T−1/2∑t=1T(f(vt,θ∗)−μ∗)T1/2[GT(θ∗)−G∗]′Wμ∗]→dN(0,[Ω11Ω21Ω12Ω22])(10)
现在分析 H1,T+H2,T(2)H_{1,T} + H_{2,T}(2)H1,T+H2,T(2):
- H1,T=GT(θ^T)′W⋅T−1/2∑t=1T(f(vt,θ∗)−μ∗)H_{1,T} = G_T(\hat{\theta}_T)' W \cdot T^{-1/2} \sum_{t=1}^T (f(v_t, \theta_*) - \mu_*)H1,T=GT(θ^T)′W⋅T−1/2∑t=1T(f(vt,θ∗)−μ∗)
- H2,T(2)=T1/2[GT(θ∗)−G∗]′Wμ∗H_{2,T}(2) = T^{1/2} [G_T(\theta_*) - G_*]' W \mu_*H2,T(2)=T1/2[GT(θ∗)−G∗]′Wμ∗
由于 θ^T→pθ∗\hat{\theta}_T \overset{p}{\to} \theta_*θ^T→pθ∗ 且 GT(⋅)G_T(\cdot)GT(⋅) 是连续函数,有 GT(θ^T)→pG∗G_T(\hat{\theta}_T) \overset{p}{\to} G_*GT(θ^T)→pG∗。因此:
H1,T+H2,T(2)=G∗′W⋅T−1/2∑t=1T(f(vt,θ∗)−μ∗)+T1/2[GT(θ∗)−G∗]′Wμ∗+op(1)
H_{1,T} + H_{2,T}(2) = G_*' W \cdot T^{-1/2} \sum_{t=1}^T (f(v_t, \theta_*) - \mu_*) + T^{1/2} [G_T(\theta_*) - G_*]' W \mu_* + o_p(1)
H1,T+H2,T(2)=G∗′W⋅T−1/2t=1∑T(f(vt,θ∗)−μ∗)+T1/2[GT(θ∗)−G∗]′Wμ∗+op(1)
这可以看作是随机向量 [UTVT]\left[ \begin{matrix} U_T \\ V_T \end{matrix} \right][UTVT] 的线性变换,其中:
- UT=T−1/2∑t=1T(f(vt,θ∗)−μ∗)U_T = T^{-1/2} \sum_{t=1}^T (f(v_t, \theta_*) - \mu_*)UT=T−1/2∑t=1T(f(vt,θ∗)−μ∗)
- VT=T1/2[GT(θ∗)−G∗]′Wμ∗V_T = T^{1/2} [G_T(\theta_*) - G_*]' W \mu_*VT=T1/2[GT(θ∗)−G∗]′Wμ∗
具体地:
H1,T+H2,T(2)=[G∗′W,Ip][UTVT]+op(1)
H_{1,T} + H_{2,T}(2) = [G_*' W, I_p] \left[ \begin{matrix} U_T \\ V_T \end{matrix} \right] + o_p(1)
H1,T+H2,T(2)=[G∗′W,Ip][UTVT]+op(1)
由联合渐近正态性(10)和连续映射定理,有:
H1,T+H2,T(2)→dN(0,ΣH)
H_{1,T} + H_{2,T}(2) \overset{d}{\to} N(0, \Sigma_H)
H1,T+H2,T(2)→dN(0,ΣH)
其中:
ΣH=[G∗′W,Ip][Ω11Ω12Ω21Ω22][WG∗Ip]=G∗′WΩ11WG∗+G∗′WΩ12+Ω21WG∗+Ω22
\Sigma_H = [G_*' W, I_p] \left[ \begin{matrix}
\Omega_{11} & \Omega_{12} \\
\Omega_{21} & \Omega_{22}
\end{matrix} \right] \left[ \begin{matrix}
W G_* \\ I_p \end{matrix} \right]
= G_*' W \Omega_{11} W G_* + G_*' W \Omega_{12} + \Omega_{21} W G_* + \Omega_{22}
ΣH=[G∗′W,Ip][Ω11Ω21Ω12Ω22][WG∗Ip]=G∗′WΩ11WG∗+G∗′WΩ12+Ω21WG∗+Ω22
这就是文档中的(A.8)式。
第4步:结合所有结果得到最终分布
现在回到公式(9):
T1/2(θ^T−θ∗)=[Ip−H0,TMT]−1H0,T{H1,T+H2,T(2)}+op(1)
T^{1/2} (\hat{\theta}_T - \theta_*) = [I_p - H_{0,T} M_T]^{-1} H_{0,T} \{ H_{1,T} + H_{2,T}(2) \} + o_p(1)
T1/2(θ^T−θ∗)=[Ip−H0,TMT]−1H0,T{H1,T+H2,T(2)}+op(1)
我们有:
- [Ip−H0,TMT]−1H0,T→p−H∗−1[I_p - H_{0,T} M_T]^{-1} H_{0,T} \overset{p}{\to} -H_*^{-1}[Ip−H0,TMT]−1H0,T→p−H∗−1 (由A.7式)
- H1,T+H2,T(2)→dN(0,ΣH)H_{1,T} + H_{2,T}(2) \overset{d}{\to} N(0, \Sigma_H)H1,T+H2,T(2)→dN(0,ΣH) (由A.8式)
应用Slutsky定理:
T1/2(θ^T−θ∗)→d−H∗−1⋅Z,其中 Z∼N(0,ΣH)
T^{1/2} (\hat{\theta}_T - \theta_*) \overset{d}{\to} -H_*^{-1} \cdot Z, \quad \text{其中 } Z \sim N(0, \Sigma_H)
T1/2(θ^T−θ∗)→d−H∗−1⋅Z,其中 Z∼N(0,ΣH)
因此:
T1/2(θ^T−θ∗)→dN(0,Σ1)
T^{1/2} (\hat{\theta}_T - \theta_*) \overset{d}{\to} N(0, \Sigma_1)
T1/2(θ^T−θ∗)→dN(0,Σ1)
其中:
Σ1=H∗−1ΣH(H∗−1)′=H∗−1(G∗′WΩ11WG∗+G∗′WΩ12+Ω21WG∗+Ω22)H∗−1′
\Sigma_1 = H_*^{-1} \Sigma_H (H_*^{-1})' = H_*^{-1} \left( G_*' W \Omega_{11} W G_* + G_*' W \Omega_{12} + \Omega_{21} W G_* + \Omega_{22} \right) H_*^{-1'}
Σ1=H∗−1ΣH(H∗−1)′=H∗−1(G∗′WΩ11WG∗+G∗′WΩ12+Ω21WG∗+Ω22)H∗−1′
证毕。
总结
这个证明严格遵循了作者的思路:
- 从一般形式公式(9)出发
- 应用本定理的特殊条件 (WT=WW_T = WWT=W) 简化表达式
- 利用联合渐近正态性(10)确定关键项 H1,T+H2,T(2)H_{1,T} + H_{2,T}(2)H1,T+H2,T(2) 的分布
- 结合概率极限(A.7)和Slutsky定理得到最终结果
公式11的来源
在定理1中,当模型正确设定时(即 μ∗=0\mu_* = 0μ∗=0),渐近方差 Σ1\Sigma_1Σ1 会简化为 Hansen (1982) 的经典公式 ΣC\Sigma_CΣC。
推导公式(11)
从定理1的结论出发,渐近方差为:
Σ1=H∗−1(G∗′WΩ11WG∗+G∗′WΩ12+Ω21WG∗+Ω22)H∗−1′
\Sigma_1 = H_*^{-1} \left( G_*' W \Omega_{11} W G_* + G_*' W \Omega_{12} + \Omega_{21} W G_* + \Omega_{22} \right) H_*^{-1'}
Σ1=H∗−1(G∗′WΩ11WG∗+G∗′WΩ12+Ω21WG∗+Ω22)H∗−1′
其中:
- H∗=G∗′WG∗+(μ∗′W⊗Ip)G∗(2)H_* = G_*' W G_* + (\mu_*' W \otimes I_p) G_*^{(2)}H∗=G∗′WG∗+(μ∗′W⊗Ip)G∗(2)(由假设5定义),
- Ω11,Ω12,Ω21,Ω22\Omega_{11}, \Omega_{12}, \Omega_{21}, \Omega_{22}Ω11,Ω12,Ω21,Ω22 是联合渐近分布(公式(10))的协方差矩阵元素。
当模型正确设定时,有 μ∗=0\mu_* = 0μ∗=0,因此:
- 简化 H∗H_*H∗:由于 μ∗=0\mu_* = 0μ∗=0,有 (μ∗′W⊗Ip)G∗(2)=0(\mu_*' W \otimes I_p) G_*^{(2)} = 0(μ∗′W⊗Ip)G∗(2)=0,所以 H∗=G∗′WG∗H_* = G_*' W G_*H∗=G∗′WG∗。从而,H∗−1=(G∗′WG∗)−1H_*^{-1} = (G_*' W G_*)^{-1}H∗−1=(G∗′WG∗)−1 和 H∗−1′=(G∗′WG∗)−1H_*^{-1'} = (G_*' W G_*)^{-1}H∗−1′=(G∗′WG∗)−1(因为 G∗′WG∗G_*' W G_*G∗′WG∗ 是对称矩阵)。
- 简化协方差项:联合渐近分布(公式(10))的第二项为 T1/2[GT(θ∗)−G∗]′Wμ∗T^{1/2} [G_T(\theta_*) - G_*]' W \mu_*T1/2[GT(θ∗)−G∗]′Wμ∗。当 μ∗=0\mu_* = 0μ∗=0 时,这一项为零向量。因此:
- Ω12=0\Omega_{12} = 0Ω12=0(第一项与第二项的协方差),
- Ω21=0\Omega_{21} = 0Ω21=0(第二项与第一项的协方差),
- Ω22=0\Omega_{22} = 0Ω22=0(第二项的方差)。
只有 Ω11\Omega_{11}Ω11 保留,它是 T−1/2∑t=1Tf(vt,θ∗)T^{-1/2} \sum_{t=1}^T f(v_t, \theta_*)T−1/2∑t=1Tf(vt,θ∗) 的渐近方差。在正确设定下,μ∗=0\mu_* = 0μ∗=0,所以 Ω11=V\Omega_{11} = VΩ11=V,其中 VVV 是矩条件 f(vt,θ∗)f(v_t, \theta_*)f(vt,θ∗) 的长期方差矩阵:
V=limT→∞Var(T−1/2∑t=1Tf(vt,θ∗)) V = \lim_{T \to \infty} \operatorname{Var} \left( T^{-1/2} \sum_{t=1}^T f(v_t, \theta_*) \right) V=T→∞limVar(T−1/2t=1∑Tf(vt,θ∗))
- 代入简化:将上述结果代入 Σ1\Sigma_1Σ1:
Σ1=(G∗′WG∗)−1(G∗′WVWG∗+0+0+0)(G∗′WG∗)−1 \Sigma_1 = (G_*' W G_*)^{-1} \left( G_*' W V W G_* + 0 + 0 + 0 \right) (G_*' W G_*)^{-1} Σ1=(G∗′WG∗)−1(G∗′WVWG∗+0+0+0)(G∗′WG∗)−1
因此:
ΣC=(G∗′WG∗)−1(G∗′WVWG∗)(G∗′WG∗)−1 \Sigma_C = (G_*' W G_*)^{-1} (G_*' W V W G_*) (G_*' W G_*)^{-1} ΣC=(G∗′WG∗)−1(G∗′WVWG∗)(G∗′WG∗)−1
这就是公式(11)。
说明
- 这个结果与 Hansen (1982) 的原始公式一致,适用于正确设定的模型。
- 当 WT=IW_T = IWT=I 时,定理1仍然成立,但 WWW 是单位矩阵,因此 ΣC\Sigma_CΣC 进一步简化。
- Gallant and White (1988) 的结果与定理1在固定加权矩阵条件下一致,但他们的分析侧重于正确设定模型,而定理1涵盖了误设模型的一般情况。
此推导展示了定理1如何作为正确设定模型下经典结果的一般化。