当前位置: 首页 > wzjs >正文

微网站是免费的吗非微信官方网页自己做的网站

微网站是免费的吗,非微信官方网页自己做的网站,分析网络营销方式,做亚马逊网站一般发什么快递公司机器学习之KL散度推导 预备知识 熵、交叉熵、条件熵 熵 (Entropy) 这一词最初来源于热力学。1948年,克劳德爱尔伍德香农将热力学中的熵引入信息论,所以也被称为香农熵 (Shannon entropy)、信息熵 (information entropy)。 对于具体熵的定义和用法推荐…

机器学习之KL散度推导

预备知识

熵、交叉熵、条件熵

熵 (Entropy) 这一词最初来源于热力学。1948年,克劳德·爱尔伍德·香农将热力学中的熵引入信息论,所以也被称为香农熵 (Shannon entropy)、信息熵 (information entropy)。

对于具体熵的定义和用法推荐大家自己再去理解,本篇文章着重分析和推导KL散度

这里我先给出这个熵的定义如下:

熵: Entropy(x) = H ( X ) = − ∑ x p ( x ) l o g 2 ( x ) \text{Entropy(x)}= H(X) = -\sum_xp(x)log_2(x) Entropy(x)=H(X)=xp(x)log2(x)

条件熵:
H ( Y ∣ X ) = ∑ x p ( x ) H ( Y ∣ X = x ) = − ∑ x p ( x ) ∑ y p ( y ∣ x ) log ⁡ 2 p ( y ∣ x ) = − ∑ x ∑ y p ( x , y ) log ⁡ 2 p ( y ∣ x ) = − ∑ x , y p ( x , y ) log ⁡ 2 p ( y ∣ x ) \begin{align*} H(\mathbf{Y}| \mathbf{X}) &= \sum_{x} p(x) H(\mathbf{Y} | \mathbf{X} = x) \\ &= - \sum_{x} p(x) \sum_{y} p(y|x) \log_2 p(y|x) \\ &= - \sum_{x} \sum_{y} p(x, y) \log_2 p(y|x) \\ &= - \sum_{x,y} p(x, y) \log_2 p(y|x) \end{align*} H(YX)=xp(x)H(YX=x)=xp(x)yp(yx)log2p(yx)=xyp(x,y)log2p(yx)=x,yp(x,y)log2p(yx)
交叉熵: Cross entropy = H ( P , Q ) = − ∑ i P ( x i ) l o g 2 Q ( x i ) \text{Cross entropy} = H(P,Q) = -\sum_iP(x_i)log_2Q(x_i) Cross entropy=H(P,Q)=iP(xi)log2Q(xi)

他们的用处是不同的,对于条件熵来说,主要是用在决策数的信息增益中,用来判断某个信息对样本集合的划分效果的影响力(好坏),当然对于连续变量,条件熵的公式不变,但变量的取值会变,如下:

在这里插入图片描述

而交叉熵则更多的用在KL散度上(据我所知😆),本次就会用到。

KL散度推导

KL散度的理论意义在于度量两个概率分布之间的差异程度,当KL散度越大的时候,说明两者的差异程度越大;而当KL散度小的时候,则说明两者的差异程度小;如果两者相同的话,则该KL散度应该为0。

公式定义为:
K L ( P ∣ ∣ Q ) = ∫ p ( x ) l o g p ( x ) q ( x ) d x KL(P||Q) = \int p(x)log\frac{p(x)}{q(x)}dx KL(P∣∣Q)=p(x)logq(x)p(x)dx

证明KL散度大于等于0:

将KL散度写成离散的形式为: K L ( P ∣ ∣ Q ) = ∑ p ( x ) l o g p ( x ) q ( x ) = − ∑ p ( x ) l o g q ( x ) p ( x ) KL(P||Q) = \sum p(x)log\frac{p(x)}{q(x)} = -\sum p(x)log\frac{q(x)}{p(x)} KL(P∣∣Q)=p(x)logq(x)p(x)=p(x)logp(x)q(x)

因为: l n ( x ) < x − 1 ln(x)<x-1 ln(x)<x1

所以:令 q ( x ) p ( x ) = x \frac{q(x)}{p(x)} = x p(x)q(x)=x
∑ p ( x ) l o g q ( x ) p ( x ) < ∑ p ( x ) ( q ( x ) p ( x ) − 1 ) ∑ p ( x ) l o g q ( x ) p ( x ) < ∑ ( q ( x ) − p ( x ) ) ∑ p ( x ) l o g q ( x ) p ( x ) < ∑ ( q ( x ) − ∑ p ( x ) ∑ p ( x ) l o g q ( x ) p ( x ) < 0 ( 概率的和为1 ) \begin{align*} \sum p(x)log\frac{q(x)}{p(x)} &< \sum p(x) \left(\frac{q(x)}{p(x)} - 1\right)\\ \sum p(x)log\frac{q(x)}{p(x)} &<\sum \left(q(x) - p(x)\right)\\ \sum p(x)log\frac{q(x)}{p(x)} &<\sum (q(x) - \sum p(x)\\ \sum p(x)log\frac{q(x)}{p(x)} &<0(\text{概率的和为1})\\ \end{align*} p(x)logp(x)q(x)p(x)logp(x)q(x)p(x)logp(x)q(x)p(x)logp(x)q(x)<p(x)(p(x)q(x)1)<(q(x)p(x))<(q(x)p(x)<0(概率的和为1)
所以:
K L ( P ∣ ∣ Q ) = ∑ p ( x ) l o g p ( x ) q ( x ) = − ∑ p ( x ) l o g q ( x ) p ( x ) > 0 KL(P||Q) = \sum p(x)log\frac{p(x)}{q(x)} = -\sum p(x)log\frac{q(x)}{p(x)} > 0 KL(P∣∣Q)=p(x)logq(x)p(x)=p(x)logp(x)q(x)>0
l o g p ( x ) q ( x ) log\frac{p(x)}{q(x)} logq(x)p(x)进行分解,可以转换为:
K L ( P ∣ ∣ Q ) = ∑ p ( x ) l o g p ( x ) q ( x ) = ∑ p ( x ) l o g p ( x ) − ∑ p ( x ) l o g q ( x ) = H ( P , Q ) − H ( P ) \begin{align*} KL(P||Q) &= \sum p(x)log\frac{p(x)}{q(x)}\\ &=\sum p(x)log p(x) - \sum p(x)log q(x)\\ &=H(P,Q) - H(P) \end{align*} KL(P∣∣Q)=p(x)logq(x)p(x)=p(x)logp(x)p(x)logq(x)=H(P,Q)H(P)

问题来了, K L ( P ∣ ∣ Q ) ≥ 0 KL(P||Q)\geq 0 KL(P∣∣Q)0,那 K L ( Q ∣ ∣ P ) KL(Q||P) KL(Q∣∣P)是否大于等于0?

答案是大于等于0,这是因为KL散度只是衡量数据之间的差异

例如:

  • K L ( P ∣ ∣ Q ) KL(P||Q) KL(P∣∣Q)衡量 Q 相对于 P 的差异

  • K L ( Q ∣ ∣ P ) KL(Q||P) KL(Q∣∣P)衡量 P 相对于 Q 的差异

设 $ P = {0.9, 0.1} , , Q = {0.8, 0.2} $

计算可得:
KL ( P ∣ ∣ Q ) = 0.9 ln ⁡ 0.9 0.8 + 0.1 ln ⁡ 0.1 0.2 ≈ 0.011 + 0.069 = 0.08 \text{KL}(P||Q) = 0.9 \ln \frac{0.9}{0.8} + 0.1 \ln \frac{0.1}{0.2} \approx 0.011 + 0.069 = 0.08 KL(P∣∣Q)=0.9ln0.80.9+0.1ln0.20.10.011+0.069=0.08
KL ( Q ∣ ∣ P ) = 0.8 ln ⁡ 0.8 0.9 + 0.2 ln ⁡ 0.2 0.1 ≈ − 0.094 + 0.139 = 0.045 \text{KL}(Q||P) = 0.8 \ln \frac{0.8}{0.9} + 0.2 \ln \frac{0.2}{0.1} \approx -0.094 + 0.139 = 0.045 KL(Q∣∣P)=0.8ln0.90.8+0.2ln0.10.20.094+0.139=0.045

可见二者结果不同,体现 KL 散度的不对称特性。

总结

KL散度是非负的,也是不对称的。

在机器学习中KL散度常用于:

  • 生成模型(如 VAE)中衡量生成分布与真实分布的差异;
  • 优化问题中引导分布逼近目标分布(如强化学习的策略更新)。

文章转载自:

http://AhlW4OpR.byywt.cn
http://5RFKcQ1J.byywt.cn
http://q4QC1r0v.byywt.cn
http://oh6iFoAu.byywt.cn
http://JCVla2SO.byywt.cn
http://wH9ZOGjB.byywt.cn
http://HEQr1Kmv.byywt.cn
http://E8j6C5wD.byywt.cn
http://mq1GLqtl.byywt.cn
http://6IUJ5uLM.byywt.cn
http://mKJDJcCX.byywt.cn
http://Dy7Xj6A1.byywt.cn
http://8z3ynNte.byywt.cn
http://Ijeou2vq.byywt.cn
http://yn04WQBz.byywt.cn
http://Mw02reDF.byywt.cn
http://CzKqghp2.byywt.cn
http://uZS1MCWT.byywt.cn
http://nOkM11mo.byywt.cn
http://jglP58z9.byywt.cn
http://drmWiaQ3.byywt.cn
http://Q4jFE55o.byywt.cn
http://sdjOLHXJ.byywt.cn
http://dUex6Kwh.byywt.cn
http://qKfOuJlI.byywt.cn
http://TjgZXKoi.byywt.cn
http://jglDHCaU.byywt.cn
http://gLnHttif.byywt.cn
http://91w7CXpR.byywt.cn
http://7Vq8wTPz.byywt.cn
http://www.dtcms.com/wzjs/670888.html

相关文章:

  • 做好网站建设静态化广东东莞天气预报15天
  • 纺织品做外贸一般在哪个网站上一个公司只能备案一个网站吗
  • 门户网站怎么开发郑州网站建设郑州网站建设
  • 网站做快捷方式青岛做网站企业
  • 门户首页网站建设方案网站建站金融模板
  • 做网站线项目从立项到结束的流程图
  • 县市区没有建设信用网站和平台大数据营销的优缺点
  • 做心悦腾龙光环的网站网络推广策划案范文5篇
  • 珠宝类企业网站(手机端)北仑网站网页建设
  • 网站怎么做动态图片电商类网站有几个主流程
  • 安徽省建设厅八大员报名网站网站建设买服务器还是数据库
  • 济南网站建设网站制作闵行区天气
  • 哪个网站可以做微商网站页面分析作业
  • 深圳网站开发找哪里wordpress怎么生成app
  • 购物网站项目简介page wordpress
  • 发布网站制作asp网站会员注册不了
  • 科技风格设计网站经验分享的网站开发
  • 网站开发的产品用什么形容词形容东莞网站建设网站排名优化
  • 做网站项目前怎么收集需求做设计网站的工作怎么样的
  • 做购物网站安全吗一份优秀的网络推广方案
  • 上海网站建设招聘国外服装设计师网站
  • 建设简单企业网站企业网站案例公司
  • 果洛wap网站建设哪家好可以自己做论坛网站吗
  • 无锡网站开发公司电话wordpress doc插件
  • 电商网站优缺点成都口碑最好的家装公司
  • 中山网站制作费用做安卓开发要去看哪些网站
  • 个人网站建设价格表零基础学it哪个专业好
  • 促销型网站公司邮箱手机怎么登录
  • php网站建设案例教程做网站几百块可信吗
  • 杨凌住房和城乡建设局网站wordpress linux 伪静态