当前位置: 首页 > news >正文

应用随机过程(三)

应用随机过程(三)

一、条件数学期望

1.基于条件概率密度函数(适用于连续随机变量)

若随机变量 X 和 Y 有联合概率密度函数 fX,Y(x,y)f_{X,Y}(x,y)fX,Y(x,y)​,且给定 Y=yY=yY=y​ 时 X 的条件密度为 fX∣Y(x∣y)f_{X|Y}(x|y)fXY(xy)​,则 条件期望 定义为:
E[X∣Y=y]=∫−∞∞x⋅fX∣Y(x∣y)dx E[X \mid Y=y] = \int_{-\infty}^{\infty} x \cdot f_{X|Y}(x|y)dx E[XY=y]=xfXY(xy)dx
注意:结果依赖于 y,因此 E[X∣Y]E[X \mid Y]E[XY] 是一个关于 Y 的随机变量


2.基于条件概率质量函数(适用于离散随机变量)
XXXYYY是离散随机变量,联合概率质量为 pX,Y(x,y)p_{X,Y}(x,y)pX,Y(x,y),给定 Y=yY=yY=y 的条件概率为 pX∣Y(x∣y)p_{X|Y}(x|y)pXY(xy),则:
E[X∣Y=y]=∑xx⋅pX∣Y(x∣y) E[X \mid Y=y] = \sum_{x} x \cdot p_{X|Y}(x|y) E[XY=y]=xxpXY(xy)
同样,E[X∣Y]E[X|Y]E[XY]YYY的函数,故为随机变量。

二、鞅

2.1 鞅的定义

在随机过程里,我们不光关心单个XXX的期望,还关心在某个时刻的观测,对未来的“最佳预测”。这个工具就是 条件期望

(Ω,F,P)(\Omega,\mathcal{F},P)(Ω,F,P) 是概率空间,{Fn}n≥0\{\mathcal{F}_n\}_{n\geq0}{Fn}n0 是一个滤过 (filtration): =={Fn}n≥0\{\mathcal{F}_n\}_{n\geq 0}{Fn}n0 是递增的 σ\sigmaσ-代数序列(即 Fn⊆Fn+1⊆F\mathcal{F}_n \subseteq \mathcal{F}_{n+1} \subseteq \mathcal{F}FnFn+1F),代表随时间增长的信息。==随机过程 {Xn}n≥0\{X_n\}_{n\geq0}{Xn}n0 称为关于 {Fn}\{\mathcal{F}_n\}{Fn} 的鞅,若满足:

  1. 适应性 (adaptedness)
    对每个 nnnXnX_nXnFn\mathcal{F}_nFn-可测的。(即:在时刻 nnn 的值完全由当时的信息决定,不依赖未来信息。)

  2. 可积性 (integrability)
    对每个 nnn,有
    E[∣Xn∣]<∞ E[|X_n|]<\infty E[Xn]<

  3. 鞅性质 (martingale property)
    对所有 nnn,有
    E[Xn+1∣Fn]=Xn, 几乎必然 (a.s.). E[X_{n+1}\mid\mathcal{F}_n]=X_n,\ \text{几乎必然 (a.s.)}. E[Xn+1Fn]=Xn, 几乎必然 (a.s.).
    对于鞅性质,我们举一个例子。假设一个赌博者,经历了前面n次赌博,平均而言,对接下来的第n+1n+1n+1次的赌资Xn+1X_{n+1}Xn+1,是等于现在的赌资XnX_nXn的。换句话说,基于现在所知道的所有信息,对未来的最佳平均预测就等于当前的值,就是未来没有系统性地上升或者下降。从而说明这个博弈就是公平的。**

2.2 上鞅与下鞅

  • 上鞅 (Submartingale)
    E[Xn+1∣Fn]≥Xn,a.s. E[X_{n+1} \mid \mathcal{F}_n] \geq X_n, \quad \text{a.s.} E[Xn+1Fn]Xn,a.s.
    表示“平均而言往上走”,有上升趋势。

  • 下鞅 (Supermartingale)
    E[Xn+1∣Fn]≤Xn,a.s. E[X_{n+1} \mid \mathcal{F}_n] \leq X_n, \quad \text{a.s.} E[Xn+1Fn]Xn,a.s.
    表示“平均而言往下走”,有下降趋势。

2.3 连续时间鞅

设过程{Xt}t≥0\{X_t\}_{t\geq0}{Xt}t0定义在连续时间上,关于滤过{Ft}t≥0\{\mathcal{F}_t\}_{t\geq0}{Ft}t0,若满足:

  1. XtX_{t}XtFt\mathcal{F}_tFt-适应的;

  2. E[∣Xt∣]<∞E[|X_t|]<\inftyE[Xt]<,对所有t≥0;t\geq0;t0;

  3. 对所有s<ts<ts<t,
    E[Xt∣Fs]=Xs,a.s. E[X_t\mid\mathcal{F}_s]=X_s,\quad\text{a.s.} E[XtFs]=Xs,a.s.

则称{Xt}\{X_t\}{Xt}是连续时间鞅。

对应地,满足”不等号版本"即是连续时间的上鞅、下鞅。

2.4 鞅的性质

  1. 公平性
    鞅建模的是“公平博弈”:在已知当前全部信息后,未来的期望收益等于现在。

  2. 保持期望
    {Xn}\{X_n\}{Xn} 是鞅,则 E[Xn+1]=E[Xn]E[X_{n+1}] = E[X_n]E[Xn+1]=E[Xn],即整个过程的期望值不随时间变化。

  3. 线性组合
    {Xn}\{X_n\}{Xn}{Yn}\{Y_n\}{Yn} 是鞅,且 α,β\alpha, \betaα,β 为常数,则 αXn+βYn\alpha X_n + \beta Y_nαXn+βYn 也是鞅。

  4. 停时性质
    在满足一定条件下,鞅过程在 “停时” 处的期望等于其初始时刻的期望。数学表示为:若 τ\tauτ 是一个合适的“停时”(随机时间),则在一定条件下
    E[Xτ]=E[X0]. E[X_\tau] = E[X_0]. E[Xτ]=E[X0].
    这是鞅论的一个重要工具。
    例:在 “时间 t” 时,仅通过 “前 t 步的信息”(Ft\mathcal{F}_tFt),就能判断 “停时是否已发生”(即是否在 t 之前或此时停止)。

  • 对称随机游走中,首次到达 1 的时间 (T=min⁡{n≥0:Xn=1}T = \min\{n \geq 0: X_n = 1\}T=min{n0:Xn=1}) 是停时(在 n 时刻,可通过前 n 步轨迹判断是否已到 1)。
  • 布朗运动中,首次触及边界 a 的时间 ($T = \inf{t \geq 0: B_t = a}\ $) 是停时。
  1. Markov 性质
    鞅不等于马尔可夫过程,但有类似的“只依赖当前”的味道:条件期望只看现在。
http://www.dtcms.com/a/393274.html

相关文章:

  • A/B测试:随机化与观察单位不一致,如何处理更科学
  • 树拍易购商业模式解析:创新与合规并行的数实融合样本
  • 使用递归求阶乘的和
  • HTML 结构与常用标签
  • AI 智能体开发工作流从哪些方面入手?
  • USBL与DVL数据融合的实时定位系统,MATLAB仿真
  • 端到端与世界模型(1):自动驾驶的基础模型从 VLM 到 VLA
  • Let’s Encrypt 免费SSL证书一键获取 - 网页版极简教程
  • IDEA指定配置文件启动
  • Python实现基于教学的优化器 (Teaching-Learning-Based Optimization, TLBO) (附完整代码)
  • 视频图像数据档案管理
  • 灰狼优化算法GWO
  • 2025csp入门组真题和解析
  • Keil-MDK程序运行和下载过程
  • 【Linux驱动】Linux字符设备框架
  • python、数据结构
  • 数字孪生能做什么?(续)
  • C++指针:高效编程的核心钥匙
  • WIN11操作系统安装PL2303TA USB转串口驱动问题
  • ​​[硬件电路-280]:两相步进电机的功能、四个接口信号与工作原理详解(电能转化为机械能)
  • conda换源
  • 博客系统UI自动化测试报告
  • 大语言模型 LLM 通过 Excel 知识库 增强日志分析,根因分析能力的技术方案(6):vLLM 为什么能够成为企业级推理事实上的标准?
  • Redis最佳实践——秒杀系统设计详解
  • 数字孪生能做什么?
  • 每天学习一个统计检验方法--协方差分析 (ANCOVA)(以噩梦障碍中的心跳诱发电位研究为例)
  • 2025年CSP-J初赛真题及答案解析
  • OpenHarmony电量与LED灯颜色定制开发
  • OpenHarmony 显示Display驱动全栈解析:DisplayLayer + Gralloc + Gfx 三位一体,打造高性能图形底座
  • 诊断中的一些复位跳转