当前位置: 首页 > news >正文

用对称化与chaining技术bound经验过程上确界的期望(Guntuboyina理论统计学笔记)

文章目录

  • 对称化
  • 特殊情况: F \cal F F是 Boolean 函数类
  • 覆盖数与packing number
  • 有限指标集的Chaining
  • 无限指标集的chaining
  • 引入envelope后的bound
  • 应用:有限VC维的Boolean函数类
  • 参考文献

TypeNotes
TitleTheoretical Statistics
Author(s)Aditya Guntuboyina
Year2018 Spring
LevelGraduate
LocationUC Berkeley
DepartmentDepartment of Statistics
Course Number210B
Lecture(s)L05–L09

UC Berkeley 的课程编号规则是:编号 1–99 的为初级本科课程,编号 100–199 的为高级本科课程,编号 200–299 的为研究生课程。

本课程是 UC Berkeley 理论统计的两门课之一,另外一门是 210A。老师是 UC Berkeley 的副教授。本课程有讲义,讲义typo较多,公式引用有少量错乱。

这门课的第一部分主要讲经验过程理论,讲得比较基础,优点是讲的线索清晰,并且是从动机出发的。

对称化

现在我们考虑如何bound E sup ⁡ f ∣ ( P n − P ) f ∣ {\rm E}\sup_f |(P_n - P)f| Esupf(PnP)f,需要用到对称化技巧和chaining技巧。

对称化就是把 E sup ⁡ f ∣ ( P n − P ) f ∣ {\rm E}\sup_f |(P_n - P)f| Esupf(PnP)f转变成 Rademacher 复杂度进行度量。Rademacher 复杂度是针对某个集合的,比如 F \cal F F,定义是先引入一系列相互独立且独立于 X i X_i Xi’s的 Rademacher 随机变量 ϵ i \epsilon_i ϵi’s,然后定义 F \cal F F 的 Rademacher 复杂度为
R n ( F ) : = E sup ⁡ f ∈ F 1 n ∣ ∑ i = 1 n ϵ i f ( X i ) ∣ R_n({\cal F}) := {\rm E}\sup_{f\in{\cal F}} \frac{1}{n} |\sum_{i=1}^{n} \epsilon_i f(X_i)| Rn(F):=EfFsupn1i=1nϵif(Xi)
这里的期望是对 ϵ i \epsilon_i ϵi’s和 X i X_i Xi’s求。

对称化引理说的是:
E sup ⁡ f ∈ F ∣ ( P n − P ) f ∣ ≤ 2 E sup ⁡ f ∈ F 1 n ∣ ∑ i = 1 n ϵ i f ( X i ) ∣ = 2 R n ( F ) {\rm E}\sup_{f\in{\cal F}} |(P_n - P)f| \leq 2 {\rm E}\sup_{f\in{\cal F}} \frac{1}{n} |\sum_{i=1}^{n} \epsilon_i f(X_i)| = 2R_n({\cal F}) EfFsup(PnP)f2EfFsupn1i=1nϵif(Xi)=2Rn(F)
于是,bound E sup ⁡ f ∣ ( P n − P ) f ∣ {\rm E}\sup_f |(P_n - P)f| Esupf(PnP)f的问题转化成了 bound R n ( F ) R_n({\cal F}) Rn(F)。一种 bound R n ( F ) R_n({\cal F}) Rn(F)的策略是,对于任意 X i X_i Xi’s,求 R n ( F ) R_n({\cal F}) Rn(F)的一致上界,即先将 X i X_i Xi’s视为固定的 x i x_i xi’s,计算上界,此时只需要考虑 ϵ i \epsilon_i ϵi’s的随机性。经典的做法是 chaining。

特殊情况: F \cal F F是 Boolean 函数类

现在考虑如何 bound R n ( F ) R_n({\cal F}) Rn(F)

在讲 chaining 之前,我们先考虑一种简单的特殊情况: F \cal F F是 Boolean 函数类,即里面的每个函数都是 0 / 1 0/1 0/1取值的。

首先介绍一个不等式:对于 ∣ A ∣ < ∞ |A|<\infty A<的集合 A ⊆ R n A\subseteq \mathbb{R}^n ARn,有
R n ( A ) = E sup ⁡ a ∈ A 1 n ∣ ∑ i = 1 n ϵ i a i ∣ ≤ 6 ln ⁡ ( 2 ∣ A ∣ ) n max ⁡ a ∈ A 1 n ∑ i = 1 n a i 2 R_n({A}) = {\rm E}\sup_{a \in A} \frac{1}{n} |\sum_{i=1}^{n} \epsilon_i a_i| \leq \sqrt{6} \sqrt{\frac{\ln(2|A|)}{n}} \max_{a\in A} \sqrt{\frac{1}{n} \sum_{i=1}^{n} a_i^2} Rn(A)=EaAsupn1i=1nϵiai6 nln(2∣A) aAmaxn1i=1nai2
由于 a i a_i ai’s 是固定的,随机性只来自有界随机变量 ϵ i \epsilon_i ϵi’s,因此可用 Hoeffding 不等式,再经过一系列处理即可得到上式。

对于 Boolean 函数类 F \cal F F,对任意 f ∈ F f\in{\cal F} fF,将 f ( x i ) f(x_i) f(xi)视为 a i a_i ai,则每个 f ( x i ) 2 ≤ 1 f(x_i)^2\leq 1 f(xi)21,于是 { ( f ( x 1 ) , ⋯   , f ( x n ) ) : f ∈ F } \{(f(x_1),\cdots,f(x_n)):f\in{\cal F}\} {(f(x1),,f(xn)):fF}就对应了上式的 A A A。该集合的基数最多为 2 n 2^n 2n,这个太大了,我们假设基数最多是 n n n的某个多项式形式,如 n c n^c nc,代入上式,可知随着 n → ∞ n\to\infty n
R n ( F ) ≤ 6 ( ln ⁡ 2 + c ln ⁡ n ) n = O ( ln ⁡ n n ) R_n({\cal F})\leq \sqrt{\frac{6(\ln 2 + c \ln n)}{n}} = O(\sqrt{\frac{\ln n }{n}}) Rn(F)n6(ln2+clnn) =O(n

相关文章:

  • Three.js搭建小米SU7三维汽车实战(1)搭建开发环境
  • vue3定于组件名字的几种方法
  • 浙江大学python程序设计(陈春晖、翁恺、季江民)习题答案-第十章
  • QT ui控件setEnabled(false) 作用
  • 亚马逊IEN新规避坑指南:两大申报盲区与合规策略解析
  • YOLOv5:调用官方权重进行检测
  • Appium 的 enableMultiWindows 参数
  • 甲骨文云服务器适合做网站吗
  • MCP Server Tool 开发学习文档
  • Veeam Backup 13 beta install
  • 跨境支付风控失效?用代理 IP 构建「地域 - 设备 - 行为」三维防护网
  • ​​Resin-3.1.12-01 安装教程:详细步骤与配置指南(Linux环境)
  • 遥控器处理器与光纤通信技术解析
  • 树 Part 8
  • 如何借助iPaaS集成平台做好API 错误码规范化
  • 日语学习-日语知识点小记-构建基础-JLPT-N4阶段(27):失敗 失败 经验
  • SSHwifty-基于Web的SSH/Telnet管理工具
  • 06算法学习_58. 区间和
  • 从连接中枢到终端接入——解析工业无线AP与客户端的协同之道
  • 山东大学软件学院创新项目实训开发日志——第十二周
  • 搜狐员工做网站的工资多少钱/快速优化网站排名的方法
  • danbold做动漫的网站/百度竞价推广一个月多少钱
  • 淄博乐达网站建设吧/网络营销具有哪些优势和吸引力
  • 网站建设在线推广/高级seo课程
  • 宝塔没有域名直接做网站怎么弄/百度百科搜索入口
  • win2003 wordpress/淘宝标题优化网站