当前位置：首页 > news >正文

RNN万能逼近定理证明

news 2025/8/20 13:59:30

RNN万能逼近定理证明

- - RNN原理图和数学表达式
  - RNN的万能逼近定理及其证明
  - - 证明

RNN原理图和数学表达式

在这里插入图片描述

$s_t=Uh_{t-1}+Wx_t+b\in\mathbb{R}^{D_h}$
- $s_t\in\mathbb{R}^{D_h}$
- $U\in\mathbb{R}^{D_h\times D_h}$
- $W\in\mathbb{R}^{D_h\times D_x}$
- $b\in\mathbb{R}^{D_h}$
$h_t=f(s_t)\in\mathbb{R}^{D_h}$
- $f$ 为sigmoid激活函数
- $h_t$ 为t时刻隐状态
$z_t=Vh_t\in\mathbb{R}^{D_z}$
- $V\in\mathbb{R}^{D_z\times D_h}$
$L_t=l(z_t,y_t)\in\mathbb{R}$
- $L=\frac{1}{T}\sum_{t=1}^TL_t$

RNN的万能逼近定理及其证明

在这里插入图片描述

证明

【引理】
深度受限的万能逼近定理：任何函数可以被足够宽的单隐层全连接神经网络逼近。

对g使用单隐藏神经网络逼近（f为激活函数，输出层线性变换C）
$s_t=g(s_{t-1},x_t)\approx Cf(As_{t-1}+Bx_t+b)=Cs'_t$
对复合函数O·g使用单隐层网络逼近（f为激活函数，输出层线性变换D）
$s'_t=f(As_{t-1}+Bx_t+b)=f(ACs_{t-1}'+Bx_t+b)$
$y_t=O(s_t)=O(g(s_{t-1},x_t))\approx Df(A's_{t-1}+B'x_t+b')=Dy'_t$
$y'_t=f(A's_{t-1}'+B'x_t+b')=f(A'Cs_{t-1}'+B'x_t+b')$

构建隐状态,得到其递推式
$h_t=\begin{bmatrix}s'_t\\y'_t\end{bmatrix}=f\left(\begin{bmatrix}AC&0\\A'C&0\end{bmatrix}\begin{bmatrix}s_{t-1}'\\y_{t-1}'\end{bmatrix}+\begin{bmatrix}b\\b'\end{bmatrix}\right)=f(Uh_t+Wx_t+a)$
$y_t=\begin{bmatrix}0&D\end{bmatrix}\begin{bmatrix}s'_t\\y'_t\end{bmatrix}=Vh_t$
即全连接RNN的形式，通过训练得到参数 $U 、 W 、 V 、 a （即可得到 A 、 B 、 A^{'} 、 B^{'} 、 b 、 b^{'} ）$
当RNN神经元数量足够多时，单隐藏神经网络能逼近函数g、O，此时RNN逼近任意非线性动力系统。