论文《Inference for Iterated GMM Under Misspecification》的例子3
在论文《Inference for Iterated GMM Under Misspecification》的例子3中,基于Schennach(2007)的工作,探讨了一个非线性模型在矩条件误设下的行为。该模型涉及估计均值参数θ,但错误地假设方差为1,而真实方差可能不同。
例子3的含义
例子3考虑一个简单的非线性模型,其中观测值 XiX_iXi 独立同分布(i.i.d.)于正态分布 N(θ0,σ2)N(\theta_0, \sigma^2)N(θ0,σ2),其中真实均值 θ0=0\theta_0 = 0θ0=0。矩函数定义为:
m(Xi,θ)=(Xi−θ(Xi−θ)2−1)
m(X_i, \theta) = \begin{pmatrix} X_i - \theta \\ (X_i - \theta)^2 - 1 \end{pmatrix}
m(Xi,θ)=(Xi−θ(Xi−θ)2−1)
第一项捕获均值误差,第二项捕获方差误差(假设方差为1)。模型误设程度定义为 α=σ2−1\alpha = \sigma^2 - 1α=σ2−1。如果 α=0\alpha = 0α=0,模型正确;否则,矩条件不成立,因为第二项的期望不为零。在误设下,GMM估计量收敛到一个伪真实参数 θ0∗\theta_0^*θ0∗,而不是真实值 θ0=0\theta_0 = 0θ0=0。该例子展示了如何计算中心化的权重矩阵,并分析了迭代GMM映射的收缩性条件。关键点是,只有当误设程度 α>−1/3\alpha > -1/3α>−1/3(即 σ2>2/3\sigma^2 > 2/3σ2>2/3) 时,迭代才保证收敛,否则映射可能不收缩。
公式来源和推导
1. 权重矩阵 W(ϕ)W(\phi)W(ϕ) 的推导
权重矩阵 W(ϕ)W(\phi)W(ϕ) 是中心化的,定义为:
W(ϕ)=E[m(Xi,ϕ)m(Xi,ϕ)′]−E[m(Xi,ϕ)]E[m(Xi,ϕ)]′
W(\phi) = E[m(X_i, \phi) m(X_i, \phi)'] - E[m(X_i, \phi)] E[m(X_i, \phi)]'
W(ϕ)=E[m(Xi,ϕ)m(Xi,ϕ)′]−E[m(Xi,ϕ)]E[m(Xi,ϕ)]′
其中 m(Xi,ϕ)=(Xi−ϕ(Xi−ϕ)2−1)m(X_i, \phi) = \begin{pmatrix} X_i - \phi \\ (X_i - \phi)^2 - 1 \end{pmatrix}m(Xi,ϕ)=(Xi−ϕ(Xi−ϕ)2−1)。
首先,计算期望 E[m(Xi,ϕ)]E[m(X_i, \phi)]E[m(Xi,ϕ)]。由于 Xi∼N(0,σ2)X_i \sim N(0, \sigma^2)Xi∼N(0,σ2) 和 α=σ2−1\alpha = \sigma^2 - 1α=σ2−1,有:
E[m(Xi,ϕ)]=(E[Xi]−ϕE[(Xi−ϕ)2]−1)=(−ϕσ2+ϕ2−1)=(−ϕα+ϕ2)
E[m(X_i, \phi)] = \begin{pmatrix} E[X_i] - \phi \\ E[(X_i - \phi)^2] - 1 \end{pmatrix} = \begin{pmatrix} -\phi \\ \sigma^2 + \phi^2 - 1 \end{pmatrix} = \begin{pmatrix} -\phi \\ \alpha + \phi^2 \end{pmatrix}
E[m(Xi,ϕ)]=(E[Xi]−ϕE[(Xi−ϕ)2]−1)=(−ϕσ2+ϕ2−1)=(−ϕα+ϕ2)
接下来,计算 E[m(Xi,ϕ)m(Xi,ϕ)′]E[m(X_i, \phi) m(X_i, \phi)']E[m(Xi,ϕ)m(Xi,ϕ)′]。令 Y=Xi−ϕY = X_i - \phiY=Xi−ϕ,则 Y∼N(−ϕ,σ2)Y \sim N(-\phi, \sigma^2)Y∼N(−ϕ,σ2)。需要计算:
- E[Y2]=σ2+ϕ2E[Y^2] = \sigma^2 + \phi^2E[Y2]=σ2+ϕ2
- E[Y3]=−3ϕσ2−ϕ3E[Y^3] = -3\phi \sigma^2 - \phi^3E[Y3]=−3ϕσ2−ϕ3(基于正态分布的三阶矩)
- E[Y4]=3σ4+6σ2ϕ2+ϕ4E[Y^4] = 3\sigma^4 + 6\sigma^2 \phi^2 + \phi^4E[Y4]=3σ4+6σ2ϕ2+ϕ4(基于正态分布的四阶矩)
因此:
E[m(Xi,ϕ)m(Xi,ϕ)′]=(E[Y2]E[Y3]−E[Y]E[Y3]−E[Y]E[Y4]−2E[Y2]+1)
E[m(X_i, \phi) m(X_i, \phi)'] = \begin{pmatrix} E[Y^2] & E[Y^3] - E[Y] \\ E[Y^3] - E[Y] & E[Y^4] - 2E[Y^2] + 1 \end{pmatrix}
E[m(Xi,ϕ)m(Xi,ϕ)′]=(E[Y2]E[Y3]−E[Y]E[Y3]−E[Y]E[Y4]−2E[Y2]+1)
代入上述期望值:
=(σ2+ϕ2−3ϕσ2−ϕ3+ϕ−3ϕσ2−ϕ3+ϕ3σ4+6σ2ϕ2+ϕ4−2(σ2+ϕ2)+1)
= \begin{pmatrix} \sigma^2 + \phi^2 & -3\phi \sigma^2 - \phi^3 + \phi \\ -3\phi \sigma^2 - \phi^3 + \phi & 3\sigma^4 + 6\sigma^2 \phi^2 + \phi^4 - 2(\sigma^2 + \phi^2) + 1 \end{pmatrix}
=(σ2+ϕ2−3ϕσ2−ϕ3+ϕ−3ϕσ2−ϕ3+ϕ3σ4+6σ2ϕ2+ϕ4−2(σ2+ϕ2)+1)
然后,计算 E[m]E[m]′E[m]E[m]'E[m]E[m]′:
E[m]E[m]′=(−ϕα+ϕ2)(−ϕα+ϕ2)=(ϕ2−ϕ(α+ϕ2)−ϕ(α+ϕ2)(α+ϕ2)2)
E[m]E[m]' = \begin{pmatrix} -\phi \\ \alpha + \phi^2 \end{pmatrix} \begin{pmatrix} -\phi & \alpha + \phi^2 \end{pmatrix} = \begin{pmatrix} \phi^2 & -\phi(\alpha + \phi^2) \\ -\phi(\alpha + \phi^2) & (\alpha + \phi^2)^2 \end{pmatrix}
E[m]E[m]′=(−ϕα+ϕ2)(−ϕα+ϕ2)=(ϕ2−ϕ(α+ϕ2)−ϕ(α+ϕ2)(α+ϕ2)2)
最后, subtract to get W(ϕ)W(\phi)W(ϕ):
W(ϕ)=E[mm′]−E[m]E[m]′
W(\phi) = E[mm'] - E[m]E[m]'
W(ϕ)=E[mm′]−E[m]E[m]′
逐元素计算:
- (1,1)元素: (σ2+ϕ2)−ϕ2=σ2=1+α(\sigma^2 + \phi^2) - \phi^2 = \sigma^2 = 1 + \alpha(σ2+ϕ2)−ϕ2=σ2=1+α
- (1,2)元素: (−3ϕσ2−ϕ3+ϕ)−(−ϕ(α+ϕ2))=−3ϕσ2−ϕ3+ϕ+ϕα+ϕ3=−2ϕσ2=−2ϕ(1+α)(-3\phi \sigma^2 - \phi^3 + \phi) - (-\phi(\alpha + \phi^2)) = -3\phi \sigma^2 - \phi^3 + \phi + \phi\alpha + \phi^3 = -2\phi \sigma^2 = -2\phi (1 + \alpha)(−3ϕσ2−ϕ3+ϕ)−(−ϕ(α+ϕ2))=−3ϕσ2−ϕ3+ϕ+ϕα+ϕ3=−2ϕσ2=−2ϕ(1+α)
- (2,2)元素: (3σ4+6σ2ϕ2+ϕ4−2σ2−2ϕ2+1)−(α+ϕ2)2(3\sigma^4 + 6\sigma^2 \phi^2 + \phi^4 - 2\sigma^2 - 2\phi^2 + 1) - (\alpha + \phi^2)^2(3σ4+6σ2ϕ2+ϕ4−2σ2−2ϕ2+1)−(α+ϕ2)2
展开 (α+ϕ2)2=α2+2αϕ2+ϕ4(\alpha + \phi^2)^2 = \alpha^2 + 2\alpha \phi^2 + \phi^4(α+ϕ2)2=α2+2αϕ2+ϕ4,并代入 α=σ2−1\alpha = \sigma^2 - 1α=σ2−1,简化后得:
2σ4+4σ2ϕ2=2(1+α)2+4(1+α)ϕ2
2\sigma^4 + 4\sigma^2 \phi^2 = 2(1+\alpha)^2 + 4(1+\alpha)\phi^2
2σ4+4σ2ϕ2=2(1+α)2+4(1+α)ϕ2
因此:
W(ϕ)=(1+α−2ϕ(1+α)−2ϕ(1+α)2(1+α)(1+α+2ϕ2))
W(\phi) = \begin{pmatrix} 1 + \alpha & -2\phi(1 + \alpha) \\ -2\phi(1 + \alpha) & 2(1+\alpha)(1+\alpha + 2\phi^2) \end{pmatrix}
W(ϕ)=(1+α−2ϕ(1+α)−2ϕ(1+α)2(1+α)(1+α+2ϕ2))
行列式 det(W(ϕ))=2(1+α)3≠0\det(W(\phi)) = 2(1+\alpha)^3 \neq 0det(W(ϕ))=2(1+α)3=0 对于 α>−1\alpha > -1α>−1,确保矩阵可逆。
2. GMM准则函数 J(θ,ϕ)J(\theta, \phi)J(θ,ϕ) 的推导
GMM准则函数为:
J(θ,ϕ)=m(θ)′W(ϕ)−1m(θ)
J(\theta, \phi) = m(\theta)' W(\phi)^{-1} m(\theta)
J(θ,ϕ)=m(θ)′W(ϕ)−1m(θ)
其中 m(θ)=E[m(Xi,θ)]=(−θα+θ2)m(\theta) = E[m(X_i, \theta)] = \begin{pmatrix} -\theta \\ \alpha + \theta^2 \end{pmatrix}m(θ)=E[m(Xi,θ)]=(−θα+θ2).
计算 W(ϕ)−1W(\phi)^{-1}W(ϕ)−1。令 A=1+αA = 1 + \alphaA=1+α,则:
W(ϕ)=(A−2ϕA−2ϕA2A(A+2ϕ2))
W(\phi) = \begin{pmatrix} A & -2\phi A \\ -2\phi A & 2A(A + 2\phi^2) \end{pmatrix}
W(ϕ)=(A−2ϕA−2ϕA2A(A+2ϕ2))
逆矩阵为:
W(ϕ)−1=1det(W)(2A(A+2ϕ2)2ϕA2ϕAA)=(A+2ϕ2A2ϕA2ϕA212A2)
W(\phi)^{-1} = \frac{1}{\det(W)} \begin{pmatrix} 2A(A + 2\phi^2) & 2\phi A \\ 2\phi A & A \end{pmatrix} = \begin{pmatrix} \frac{A + 2\phi^2}{A^2} & \frac{\phi}{A^2} \\ \frac{\phi}{A^2} & \frac{1}{2A^2} \end{pmatrix}
W(ϕ)−1=det(W)1(2A(A+2ϕ2)2ϕA2ϕAA)=(A2A+2ϕ2A2ϕA2ϕ2A21)
然后计算 J(θ,ϕ)=m(θ)′W(ϕ)−1m(θ)J(\theta, \phi) = m(\theta)' W(\phi)^{-1} m(\theta)J(θ,ϕ)=m(θ)′W(ϕ)−1m(θ)。通过代数展开(过程繁琐),得到:
J(θ,ϕ)=θ4−4ϕθ3+2(2(1+α)+2ϕ2−1)θ2−4αϕθ+α22(1+α)2
J(\theta, \phi) = \frac{\theta^4 - 4\phi \theta^3 + 2(2(1+\alpha) + 2\phi^2 - 1)\theta^2 - 4\alpha \phi \theta + \alpha^2}{2(1+\alpha)^2}
J(θ,ϕ)=2(1+α)2θ4−4ϕθ3+2(2(1+α)+2ϕ2−1)θ2−4αϕθ+α2
这个表达式是通过将 m(θ)m(\theta)m(θ) 和 W(ϕ)−1W(\phi)^{-1}W(ϕ)−1 代入并展开二次型得到的。具体步骤涉及矩阵乘法和对 θ\thetaθ 的多项式整理。
3. 迭代GMM映射 g(ϕ)g(\phi)g(ϕ) 和收缩性
迭代GMM映射定义为:
g(ϕ)=argminθJ(θ,ϕ)
g(\phi) = \arg\min_{\theta} J(\theta, \phi)
g(ϕ)=argθminJ(θ,ϕ)
由于 J(θ,ϕ)J(\theta, \phi)J(θ,ϕ) 是 θ\thetaθ 的四次函数,最小化需要通过数值方法求解。论文通过隐函数定理分析 g(ϕ)g(\phi)g(ϕ) 的导数:
∂g(ϕ)∂ϕ=−(∂2J∂θ2∣θ=g(ϕ))−1∂2J∂θ∂ϕ∣θ=g(ϕ)
\frac{\partial g(\phi)}{\partial \phi} = - \left( \frac{\partial^2 J}{\partial \theta^2} \bigg|_{\theta=g(\phi)} \right)^{-1} \frac{\partial^2 J}{\partial \theta \partial \phi} \bigg|_{\theta=g(\phi)}
∂ϕ∂g(ϕ)=−(∂θ2∂2Jθ=g(ϕ))−1∂θ∂ϕ∂2Jθ=g(ϕ)
并通过数值验证发现,当 α>−1/3\alpha > -1/3α>−1/3 时,∣∂g(ϕ)∂ϕ∣<1\left| \frac{\partial g(\phi)}{\partial \phi} \right| < 1∂ϕ∂g(ϕ)<1,即 g(ϕ)g(\phi)g(ϕ) 是收缩映射,保证迭代收敛。否则,对于 α≤−1/3\alpha \leq -1/3α≤−1/3,可能不收敛。
4. 固定点和误设界限
固定点满足 g(ϕ)=ϕg(\phi) = \phig(ϕ)=ϕ。当 θ0=0\theta_0 = 0θ0=0,计算 J(0,0)J(0,0)J(0,0):
J(0,0)=α22(1+α)2
J(0,0) = \frac{\alpha^2}{2(1+\alpha)^2}
J(0,0)=2(1+α)2α2
如果 α≤−1/3\alpha \leq -1/3α≤−1/3,则 J(0,0)≥18J(0,0) \geq \frac{1}{8}J(0,0)≥81。因此,误设程度较大时,准则函数值有下界,假设1.6(轻微误设)需要限制 α>−1/3\alpha > -1/3α>−1/3 以确保迭代收敛。
总结
例子3展示了在非线性矩条件下,迭代GMM的收敛性依赖于误设程度。只有当方差误设较小(σ2>2/3\sigma^2 > 2/3σ2>2/3) 时,迭代才保证收敛。否则,可能需要使用稳健推断方法。