当前位置: 首页 > news >正文

RNN万能逼近定理证明

RNN万能逼近定理证明

      • RNN原理图和数学表达式
      • RNN的万能逼近定理及其证明
        • 证明

RNN原理图和数学表达式

在这里插入图片描述

  • s t = U h t − 1 + W x t + b ∈ R D h s_t=Uh_{t-1}+Wx_t+b\in\mathbb{R}^{D_h} st=Uht1+Wxt+bRDh

    • s t ∈ R D h s_t\in\mathbb{R}^{D_h} stRDh
    • U ∈ R D h × D h U\in\mathbb{R}^{D_h\times D_h} URDh×Dh
    • W ∈ R D h × D x W\in\mathbb{R}^{D_h\times D_x} WRDh×Dx
    • b ∈ R D h b\in\mathbb{R}^{D_h} bRDh
  • h t = f ( s t ) ∈ R D h h_t=f(s_t)\in\mathbb{R}^{D_h} ht=f(st)RDh

    • f f f 为sigmoid激活函数
    • h t h_t ht 为t时刻隐状态
  • z t = V h t ∈ R D z z_t=Vh_t\in\mathbb{R}^{D_z} zt=VhtRDz

    • V ∈ R D z × D h V\in\mathbb{R}^{D_z\times D_h} VRDz×Dh
  • L t = l ( z t , y t ) ∈ R L_t=l(z_t,y_t)\in\mathbb{R} Lt=l(zt,yt)R

    • L = 1 T ∑ t = 1 T L t L=\frac{1}{T}\sum_{t=1}^TL_t L=T1t=1TLt

RNN的万能逼近定理及其证明

在这里插入图片描述

证明

【引理】
深度受限的万能逼近定理:任何函数可以被足够宽的单隐层全连接神经网络逼近。

对g使用单隐藏神经网络逼近(f为激活函数,输出层线性变换C)
s t = g ( s t − 1 , x t ) ≈ C f ( A s t − 1 + B x t + b ) = C s t ′ s_t=g(s_{t-1},x_t)\approx Cf(As_{t-1}+Bx_t+b)=Cs'_t st=g(st1,xt)Cf(Ast1+Bxt+b)=Cst
对复合函数O·g使用单隐层网络逼近(f为激活函数,输出层线性变换D)
s t ′ = f ( A s t − 1 + B x t + b ) = f ( A C s t − 1 ′ + B x t + b ) s'_t=f(As_{t-1}+Bx_t+b)=f(ACs_{t-1}'+Bx_t+b) st=f(Ast1+Bxt+b)=f(ACst1+Bxt+b)
y t = O ( s t ) = O ( g ( s t − 1 , x t ) ) ≈ D f ( A ′ s t − 1 + B ′ x t + b ′ ) = D y t ′ y_t=O(s_t)=O(g(s_{t-1},x_t))\approx Df(A's_{t-1}+B'x_t+b')=Dy'_t yt=O(st)=O(g(st1,xt))Df(Ast1+Bxt+b)=Dyt
y t ′ = f ( A ′ s t − 1 ′ + B ′ x t + b ′ ) = f ( A ′ C s t − 1 ′ + B ′ x t + b ′ ) y'_t=f(A's_{t-1}'+B'x_t+b')=f(A'Cs_{t-1}'+B'x_t+b') yt=f(Ast1+Bxt+b)=f(ACst1+Bxt+b)

构建隐状态,得到其递推式
h t = [ s t ′ y t ′ ] = f ( [ A C 0 A ′ C 0 ] [ s t − 1 ′ y t − 1 ′ ] + [ b b ′ ] ) = f ( U h t + W x t + a ) h_t=\begin{bmatrix}s'_t\\y'_t\end{bmatrix}=f\left(\begin{bmatrix}AC&0\\A'C&0\end{bmatrix}\begin{bmatrix}s_{t-1}'\\y_{t-1}'\end{bmatrix}+\begin{bmatrix}b\\b'\end{bmatrix}\right)=f(Uh_t+Wx_t+a) ht=[styt]=f([ACAC00][st1yt1]+[bb])=f(Uht+Wxt+a)
y t = [ 0 D ] [ s t ′ y t ′ ] = V h t y_t=\begin{bmatrix}0&D\end{bmatrix}\begin{bmatrix}s'_t\\y'_t\end{bmatrix}=Vh_t yt=[0D][styt]=Vht
即全连接RNN的形式,通过训练得到参数 U 、 W 、 V 、 a (即可得到 A 、 B 、 A ′ 、 B ′ 、 b 、 b ′ ) U、W、V、a(即可得到A、B、A'、B'、b、b') UWVa(即可得到ABABbb
当RNN神经元数量足够多时,单隐藏神经网络能逼近函数g、O,此时RNN逼近任意非线性动力系统。

http://www.dtcms.com/a/109982.html

相关文章:

  • 《2024年全球DDoS攻击态势分析》
  • 2025年内外网文件交换系统排名分析
  • 【3.软件工程】3.5 V开发模型
  • 深度学习与神经网络 | 邱锡鹏 | 第二章学习笔记
  • 微服务。1 微服务
  • Java学习总结-IO流
  • 如何免费制作办事指南二维码
  • 如何进行风电场微观选址
  • 如何在Windows上找到Python安装路径?两种方法快速定位
  • 深度学习deeplearn3
  • 基于飞桨框架3.0本地DeepSeek-R1蒸馏版部署实战
  • 质检LIMS系统在环境监测站的应用 环境监测场景下的LIMS系统应用
  • thinkphp每条一级栏目中可自定义添加多条二级栏目,每条二级栏目包含多个字段信息
  • 连接与效率的艺术:解码ToB 移动端协同产品的用户体验设计奥秘
  • PyTorch优化器
  • K8S学习之基础七十三:Istio简介和部署
  • 牛客 简写单词
  • NO.62十六届蓝桥杯备战|基础算法-二分查找|查找元素的第一个和最后一个位置|牛可乐和魔法封印|A-B数对|烦恼的高考意愿(C++)
  • 原生JS写一个JSON格式化工具
  • LeeCode 5. 最长回文字串
  • QT Quick(C++)跨平台应用程序项目实战教程 6 — 弹出框
  • UE5学习笔记 FPS游戏制作40 制作鼠标移入UI显示提示背景色的效果
  • C 语言中的递归:概念、应用与实例解析
  • 3D动画动作捕捉设备:惯性动捕赋能轻量级影视动画创作
  • Python Cookbook-5.1 对字典排序
  • 新版本AndroidStudio配置maven阿里云镜像
  • AI技术新突破:多模态与语音大模型重塑智能交互
  • VTK的两种显示刷新方式
  • 06-Spring 中的事件驱动机制
  • JAVA学习小记之IO流04--转换流篇