论文《Inference for Iterated GMM Under Misspecification》的例子2
在论文《Inference for Iterated GMM Under Misspecification》的例子2中,作者通过一个线性工具变量(IV)模型展示了在模型误设(misspecification)下迭代GMM估计量的行为。该例子旨在说明,即使工具变量无效(违反排除限制),迭代GMM估计量仍能通过收缩映射收敛到一个伪真实参数(pseudo-true parameter),且该固定点对误设程度不敏感。
例子含义
例子2考虑一个线性IV模型:
Yi=Xiθ0+εi,E[Ziεi]=0
Y_i = X_i \theta_0 + \varepsilon_i, \quad E[Z_i \varepsilon_i] = 0
Yi=Xiθ0+εi,E[Ziεi]=0
其中 XiX_iXi 和 θ0\theta_0θ0 是标量,Zi=(Z1i,Z2i)′Z_i = (Z_{1i}, Z_{2i})'Zi=(Z1i,Z2i)′ 是两个工具变量。矩函数定义为:
m(Wi,θ)=(Z1i(Yi−Xiθ),Z2i(Yi−Xiθ))′
m(W_i, \theta) = \left( Z_{1i} (Y_i - X_i \theta), Z_{2i} (Y_i - X_i \theta) \right)'
m(Wi,θ)=(Z1i(Yi−Xiθ),Z2i(Yi−Xiθ))′
但真实数据生成过程(DGP)存在误设:
Yi=Xi+α(Z1i−Z2i)+ei,Xi=Z1i+Z2i+ui
Y_i = X_i + \alpha (Z_{1i} - Z_{2i}) + e_i, \quad X_i = Z_{1i} + Z_{2i} + u_i
Yi=Xi+α(Z1i−Z2i)+ei,Xi=Z1i+Z2i+ui
其中 Zi∼i.i.d. N(0,I2)Z_i \sim i.i.d. \, N(0, I_2)Zi∼i.i.d.N(0,I2),且 (ei,ui)′∼i.i.d. N(0,Σ)(e_i, u_i)' \sim i.i.d. \, N(0, \Sigma)(ei,ui)′∼i.i.d.N(0,Σ),Σ=[10.50.51]\Sigma = \begin{bmatrix} 1 & 0.5 \\ 0.5 & 1 \end{bmatrix}Σ=[10.50.51]。如果 α≠0\alpha \neq 0α=0,则工具变量 Z1iZ_{1i}Z1i 和 Z2iZ_{2i}Z2i 直接影响 YiY_iYi,违反排除限制,导致矩条件不成立对于任何 θ\thetaθ。
在误设下,GMM估计量不再收敛到真实参数 θ0\theta_0θ0,而是收敛到一个伪真实参数。例子显示,迭代GMM映射 g(ϕ)g(\phi)g(ϕ) 是一个收缩映射(收缩系数小于 2/32/32/3),无论 α\alphaα 如何(即无论误设程度如何),都能保证收敛。最小化的总体准则函数 J(g(ϕ),ϕ)J(g(\phi), \phi)J(g(ϕ),ϕ) 有界,且固定点为 θ=1\theta = 1θ=1(即 θ0=1\theta_0 = 1θ0=1),对误设程度不变。
公式来源和推导
GMM映射 g(ϕ)g(\phi)g(ϕ) 的推导
GMM映射 g(ϕ)g(\phi)g(ϕ) 定义为给定权重矩阵 W(ϕ)W(\phi)W(ϕ) 下最小化准则函数 J(θ,ϕ)=m(θ)′W(ϕ)−1m(θ)J(\theta, \phi) = m(\theta)' W(\phi)^{-1} m(\theta)J(θ,ϕ)=m(θ)′W(ϕ)−1m(θ) 的值,其中 m(θ)=E[m(Wi,θ)]m(\theta) = E[m(W_i, \theta)]m(θ)=E[m(Wi,θ)] 是总体矩条件。权重矩阵 W(ϕ)=E[m(Wi,ϕ)m(Wi,ϕ)′]W(\phi) = E[m(W_i, \phi) m(W_i, \phi)']W(ϕ)=E[m(Wi,ϕ)m(Wi,ϕ)′]。
从DGP出发,首先计算总体矩条件 m(θ)m(\theta)m(θ):
m(θ)=E[m(Wi,θ)]=(E[Z1i(Yi−Xiθ)]E[Z2i(Yi−Xiθ)])
m(\theta) = E[m(W_i, \theta)] = \begin{pmatrix} E[Z_{1i} (Y_i - X_i \theta)] \\ E[Z_{2i} (Y_i - X_i \theta)] \end{pmatrix}
m(θ)=E[m(Wi,θ)]=(E[Z1i(Yi−Xiθ)]E[Z2i(Yi−Xiθ)])
使用DGP:
Yi=Xi+α(Z1i−Z2i)+ei,Xi=Z1i+Z2i+ui
Y_i = X_i + \alpha (Z_{1i} - Z_{2i}) + e_i, \quad X_i = Z_{1i} + Z_{2i} + u_i
Yi=Xi+α(Z1i−Z2i)+ei,Xi=Z1i+Z2i+ui
且 ZiZ_iZi 与 ei,uie_i, u_iei,ui 独立。计算期望:
E[Z1iYi]=E[Z1iXi]+αE[Z1i2]−αE[Z1iZ2i]+E[Z1iei]=1+α⋅1−α⋅0+0=1+α
E[Z_{1i} Y_i] = E[Z_{1i} X_i] + \alpha E[Z_{1i}^2] - \alpha E[Z_{1i} Z_{2i}] + E[Z_{1i} e_i] = 1 + \alpha \cdot 1 - \alpha \cdot 0 + 0 = 1 + \alpha
E[Z1iYi]=E[Z1iXi]+αE[Z1i2]−αE[Z1iZ2i]+E[Z1iei]=1+α⋅1−α⋅0+0=1+α
E[Z1iXi]=E[Z1i(Z1i+Z2i+ui)]=1+0+0=1
E[Z_{1i} X_i] = E[Z_{1i} (Z_{1i} + Z_{2i} + u_i)] = 1 + 0 + 0 = 1
E[Z1iXi]=E[Z1i(Z1i+Z2i+ui)]=1+0+0=1
所以:
E[Z1i(Yi−Xiθ)]=(1+α)−θ⋅1=1+α−θ
E[Z_{1i} (Y_i - X_i \theta)] = (1 + \alpha) - \theta \cdot 1 = 1 + \alpha - \theta
E[Z1i(Yi−Xiθ)]=(1+α)−θ⋅1=1+α−θ
类似:
E[Z2iYi]=E[Z2iXi]+αE[Z2iZ1i]−αE[Z2i2]+E[Z2iei]=1+α⋅0−α⋅1+0=1−α
E[Z_{2i} Y_i] = E[Z_{2i} X_i] + \alpha E[Z_{2i} Z_{1i}] - \alpha E[Z_{2i}^2] + E[Z_{2i} e_i] = 1 + \alpha \cdot 0 - \alpha \cdot 1 + 0 = 1 - \alpha
E[Z2iYi]=E[Z2iXi]+αE[Z2iZ1i]−αE[Z2i2]+E[Z2iei]=1+α⋅0−α⋅1+0=1−α
E[Z2iXi]=1
E[Z_{2i} X_i] = 1
E[Z2iXi]=1
所以:
E[Z2i(Yi−Xiθ)]=(1−α)−θ⋅1=1−α−θ
E[Z_{2i} (Y_i - X_i \theta)] = (1 - \alpha) - \theta \cdot 1 = 1 - \alpha - \theta
E[Z2i(Yi−Xiθ)]=(1−α)−θ⋅1=1−α−θ
因此:
m(θ)=(1+α−θ1−α−θ)
m(\theta) = \begin{pmatrix} 1 + \alpha - \theta \\ 1 - \alpha - \theta \end{pmatrix}
m(θ)=(1+α−θ1−α−θ)
权重矩阵 W(ϕ)W(\phi)W(ϕ) 的计算更复杂,涉及二阶矩。基于DGP,作者通过代数推导得到:
W(ϕ)=E[m(Wi,ϕ)m(Wi,ϕ)′]
W(\phi) = E[m(W_i, \phi) m(W_i, \phi)']
W(ϕ)=E[m(Wi,ϕ)m(Wi,ϕ)′]
并最终得到GMM映射的简化表达式:
g(ϕ)=5−7ϕ+3ϕ2+α2(2+4ϕ)5−7ϕ+3ϕ2+6α2
g(\phi) = \frac{5 - 7\phi + 3\phi^2 + \alpha^2 (2 + 4\phi)}{5 - 7\phi + 3\phi^2 + 6\alpha^2}
g(ϕ)=5−7ϕ+3ϕ2+6α25−7ϕ+3ϕ2+α2(2+4ϕ)
这个表达式是通过求解一阶条件 ∂J(θ,ϕ)∂θ=0\frac{\partial J(\theta, \phi)}{\partial \theta} = 0∂θ∂J(θ,ϕ)=0 得到的,其中 J(θ,ϕ)=m(θ)′W(ϕ)−1m(θ)J(\theta, \phi) = m(\theta)' W(\phi)^{-1} m(\theta)J(θ,ϕ)=m(θ)′W(ϕ)−1m(θ)。由于 m(θ)m(\theta)m(θ) 是线性的,JJJ 是 θ\thetaθ 的二次型,最小化问题有闭式解。
收缩映射性质
计算 g(ϕ)g(\phi)g(ϕ) 的导数:
∂g(ϕ)∂ϕ=(−7+6ϕ+4α2)D(ϕ)−N(ϕ)(−7+6ϕ)[D(ϕ)]2
\frac{\partial g(\phi)}{\partial \phi} = \frac{ (-7 + 6\phi + 4\alpha^2) D(\phi) - N(\phi) (-7 + 6\phi) }{ [D(\phi)]^2 }
∂ϕ∂g(ϕ)=[D(ϕ)]2(−7+6ϕ+4α2)D(ϕ)−N(ϕ)(−7+6ϕ)
其中 N(ϕ)=5−7ϕ+3ϕ2+2α2+4α2ϕN(\phi) = 5 - 7\phi + 3\phi^2 + 2\alpha^2 + 4\alpha^2 \phiN(ϕ)=5−7ϕ+3ϕ2+2α2+4α2ϕ,D(ϕ)=5−7ϕ+3ϕ2+6α2D(\phi) = 5 - 7\phi + 3\phi^2 + 6\alpha^2D(ϕ)=5−7ϕ+3ϕ2+6α2。论文声称 ∣∂g(ϕ)∂ϕ∣<23\left| \frac{\partial g(\phi)}{\partial \phi} \right| < \frac{2}{3}∂ϕ∂g(ϕ)<32 对于所有实数 α\alphaα 和 ϕ\phiϕ,因此 g(ϕ)g(\phi)g(ϕ) 是收缩映射。这确保了迭代序列收敛到唯一固定点。
固定点求解
固定点满足 g(ϕ)=ϕg(\phi) = \phig(ϕ)=ϕ。解方程:
ϕ=5−7ϕ+3ϕ2+α2(2+4ϕ)5−7ϕ+3ϕ2+6α2
\phi = \frac{5 - 7\phi + 3\phi^2 + \alpha^2 (2 + 4\phi)}{5 - 7\phi + 3\phi^2 + 6\alpha^2}
ϕ=5−7ϕ+3ϕ2+6α25−7ϕ+3ϕ2+α2(2+4ϕ)
两边同乘分母:
ϕ(5−7ϕ+3ϕ2+6α2)=5−7ϕ+3ϕ2+α2(2+4ϕ)
\phi (5 - 7\phi + 3\phi^2 + 6\alpha^2) = 5 - 7\phi + 3\phi^2 + \alpha^2 (2 + 4\phi)
ϕ(5−7ϕ+3ϕ2+6α2)=5−7ϕ+3ϕ2+α2(2+4ϕ)
简化后可得:
3ϕ3−10ϕ2+12ϕ+2α2ϕ−5−2α2=0
3\phi^3 - 10\phi^2 + 12\phi + 2\alpha^2 \phi - 5 - 2\alpha^2 = 0
3ϕ3−10ϕ2+12ϕ+2α2ϕ−5−2α2=0
验证 ϕ=1\phi = 1ϕ=1 是根:
3(1)3−10(1)2+12(1)+2α2(1)−5−2α2=3−10+12+2α2−5−2α2=0
3(1)^3 - 10(1)^2 + 12(1) + 2\alpha^2 (1) - 5 - 2\alpha^2 = 3 - 10 + 12 + 2\alpha^2 - 5 - 2\alpha^2 = 0
3(1)3−10(1)2+12(1)+2α2(1)−5−2α2=3−10+12+2α2−5−2α2=0
因此固定点为 θ=1\theta = 1θ=1,无论 α\alphaα 如何。这意味着伪真实参数是 θ0=1\theta_0 = 1θ0=1,对误设程度不变。
准则函数值
最小化准则函数值:
J(g(ϕ),ϕ)=(3α2+32(ϕ−76)2+1124)−1α2<13
J(g(\phi), \phi) = \left( 3\alpha^2 + \frac{3}{2} \left( \phi - \frac{7}{6} \right)^2 + \frac{11}{24} \right)^{-1} \alpha^2 < \frac{1}{3}
J(g(ϕ),ϕ)=(3α2+23(ϕ−67)2+2411)−1α2<31
有界且依赖于 α\alphaα 但 not ϕ\phiϕ。
一般IV模型的讨论
论文还考虑一般IV模型:
Yi=Xiθ0+Zi′α+εi,Xi=Zi′π+ui
Y_i = X_i \theta_0 + Z_i' \alpha + \varepsilon_i, \quad X_i = Z_i' \pi + u_i
Yi=Xiθ0+Zi′α+εi,Xi=Zi′π+ui
其中 ZiZ_iZi 是 l×1l \times 1l×1 向量。如果 α≠0\alpha \neq 0α=0,工具变量无效。GMM映射为:
g(ϕ)=θ0+(π′ΣW(ϕ)−1Σπ)−1π′ΣW(ϕ)−1Σα
g(\phi) = \theta_0 + (\pi' \Sigma W(\phi)^{-1} \Sigma \pi)^{-1} \pi' \Sigma W(\phi)^{-1} \Sigma \alpha
g(ϕ)=θ0+(π′ΣW(ϕ)−1Σπ)−1π′ΣW(ϕ)−1Σα
其中 Σ=E[ZiZi′]\Sigma = E[Z_i Z_i']Σ=E[ZiZi′]。如果 πα′=απ′\pi \alpha' = \alpha \pi'πα′=απ′(例如所有工具有效或 π\piπ 与 α\alphaα 成比例),则 ∣∂g(ϕ)∂ϕ∣=0\left| \frac{\partial g(\phi)}{\partial \phi} \right| = 0∂ϕ∂g(ϕ)=0,无需迭代。这在实践中可能近似成立,例如强工具无效但弱工具有效。
结论
例子2展示了迭代GMM在误设下的稳健性:映射是收缩的,固定点存在唯一,且准则函数有界。假设1.6(轻微误设条件)在此例中不必要的,因为收缩性对所有 α\alphaα 成立。公式推导基于DGP的代数计算,但论文省略了详细步骤,专注于理论洞察。