当前位置: 首页 > news >正文

Wasserstein 距离简介

  • 参考:Optimal Transport and Wasserstein Distance

  • 机器学习中我们常常要度量两个分布间的距离,常用的度量包括 KL 散度、JS 散度、总变差距离等。Wasserstein 距离又称推土机距离,是一种基于最优传输思想的度量,其从几何角度衡量一个分布“变形”为另一个分布所需的最小代价

文章目录

  • 1. Wasserstein 距离的定义
  • 2. Wasserstein 距离的优点
    • 2.1 可处理支撑集不重叠的情况
    • 2.2 Wasserstein 平均维持了原始分布的形态特征
    • 2.3 Wasserstein 距离反映了分布的转化过程
    • 2.4 基于 Wasserstein 距离定义测地线可在变换过程中保存分布的形态结构
  • 3. 通过累积分布函数(CDF)计算 Wasserstein 距离

1. Wasserstein 距离的定义

  • Wasserstein 距离:记紧空间 Ω \Omega Ω 上的所有概率分布组成的空间为 P ( Ω ) \mathcal{P}(\Omega) P(Ω),设分布 P , Q ∈ P ( Ω ) P,Q\in \mathcal{P}(\Omega) P,QP(Ω),随机变量 X , Y X,Y X,Y 分布服从分布 P , Q P,Q P,Q,设 J ( P , Q ) \mathcal{J}(P,Q) J(P,Q) 表示随机向量 ( X , Y ) (X,Y) (X,Y) 的所有联合分布,即任意联合分布 J ∈ J ( P , Q ) J\in \mathcal{J}(P,Q) JJ(P,Q) 的边缘分布为 P , Q P,Q P,Q,Wasserstein 距离定义为
    W p ( P , Q ) = ( inf ⁡ J ∈ J ( P , Q ) ∫ Ω × Ω ∥ x − y ∥ p d J ( x , y ) ) 1 p (1) W_{p}(P, Q)=\left(\inf _{J \in \mathcal{J}(P, Q)} \int_{\Omega \times \Omega}\|x-y\|^{p} d J(x, y)\right)^{\frac{1}{p}} \tag{1} Wp(P,Q)=(JJ(P,Q)infΩ×ΩxypdJ(x,y))p1(1)
  • 直观来看,Wasserstein 距离就是在所有把分布 P P P 变为 Q Q Q 的联合分布(搬运方案)中,期望搬运代价的最小值
    在这里插入图片描述
    1. 如图所示,任意联合分布 J J J 可以看作把分布 P P P 转换为分布 Q Q Q 的一种方式。联合分布 J J J 上任意一点 J ( x , y ) J(x,y) J(x,y) 可以看作将来自 P P P 的概率质量的一部分从位置 x x x 搬运到 Q Q Q 的位置 y y y 的方式,即图中红色线
    2. 积分 ∫ Ω × Ω ∥ x − y ∥ p d J ( x , y ) \int_{\Omega \times \Omega}\|x-y\|^{p} d J(x, y) Ω×ΩxypdJ(x,y) 可以理解为 “按照分配方案 J J J 把分布 P P P 搬运成分布 Q Q Q 所需的平均搬运成本,其中从 x x x y y y 的 “搬运” 代价为 ∥ x − y ∥ p \|x-y\|^{p} xyp,被搬运的概率质量为 J ( x , y ) J(x,y) J(x,y)
    3. 下确界符号 inf ⁡ J ∈ J ( P , Q ) \inf _{J \in \mathcal{J}(P, Q)} infJJ(P,Q) 表示在所有可能的搬运方案 J \mathcal{J} J 里选出那个搬运成本最小的
http://www.dtcms.com/a/532411.html

相关文章:

  • 南宁网站建设外包vs做的网站如何
  • 【C++】前缀和算法习题
  • GitHub等平台形成的开源文化正在重塑加特
  • 基于单片机的家庭防盗防火智能门窗报警系统设计
  • 响应式网站建设的未来发展网络规划与设计就业前景
  • 【图像处理】图像错切变换
  • Docker环境离线安装-linux服务器
  • 软件设计师知识点总结:结构化开发
  • 持续改变源于团队学习
  • Unity安装newtonsoft
  • Spring Boot3零基础教程,整合 Redis,笔记69
  • 凡科网站官网登录入口wordpress 列表模板
  • 读论文AI prompt
  • 《Ionic 平台:全面解析与深入探讨》
  • 网站做淘宝客有什么要求微网站的优势
  • FFmpeg 基本数据结构 AVStream分析
  • kafka数据同步一致性问题
  • 淘宝网站的建设内容网站建设的平台
  • Linux进程间通信:管道与System V IPC的全解析
  • 技术选型对比:几种主流方案获取淘宝商品实时数据的优劣分析
  • 想象力网站建设深圳市房地产信息系统平台
  • 让 Codex 用 React 生成一个博客首页
  • Kafka的概念
  • 开发实战 - ego商城 - 补充:小程序性能优化
  • 如何截取PDF内容为图片
  • 智慧景区导览小程序
  • 58同城企业网站怎么做的wordpress 评论设计
  • 珠海建站模板怎么做多语言网站
  • 致敬哈耶克,让灯火照亮个人前行的道路
  • 【LeetCode100】--- 96.只出现一次的数字【思维导图+复习回顾】