当前位置: 首页 > news >正文

一维/二维高斯分布的负对数似然推导

参考wikipedia Multivariate normal distribution 及 Normal distribution

基础公式

多元高斯分布公式
f ( X ) = f ( x 1 , x 2 , . . . , x k ) = 1 ( 2 π ) k ∣ ∑ ∣ e − 1 2 ( X − μ ) T ∑ − 1 ( X − μ ) f(X)=f(x_1,x_2,...,x_k)=\frac{1}{\sqrt{{(2\pi)}^k|\sum|}}e^{-\frac{1}{2}(X-\mu)^T\sum^{-1}(X-\mu)} f(X)=f(x1,x2,...,xk)=(2π)k 1e21(Xμ)T1(Xμ)
其中, μ = ( μ x 1 , μ x 2 , . . . , μ x k ) \mu=(\mu_{x_1},\mu_{x_2},...,\mu_{x_k}) μ=(μx1,μx2,...,μxk)
那么一维高斯分布公式
f ( x ) = 1 2 π σ 2 e − ( x − μ x ) 2 2 σ 2 f(x)=\frac{1}{\sqrt{2\pi\sigma^2}}e^{-\frac{(x-\mu_x)^2}{2\sigma^2} } f(x)=2πσ2 1e2σ2(xμx)2
二维高斯分布公式
f ( x , y ) = 1 2 π ∣ ∑ ∣ e − 1 2 ( x − μ x y − μ y ) ∑ − 1 ( x − μ x y − μ y ) f(x,y)=\frac{1}{2\pi\sqrt{|\sum|}}e^{-\frac{1}{2} \begin{pmatrix}x-\mu_x &y-\mu_y\end{pmatrix}\sum^{-1}\begin{pmatrix}x-\mu_x \\ y-\mu_y\end{pmatrix}}\\ f(x,y)=2π 1e21(xμxyμy)1(xμxyμy)

为简化推导,后文将 d x = x − μ x d_x=x-\mu_x dx=xμx 记为x

一维高斯分布的负对数似然

N L L ( x , μ ∣ σ 2 ) = − l o g ( f ( x ) ) = − l o g ( 1 2 π σ 2 e − x 2 2 σ 2 ) = − ( − l o g ( 2 π σ 2 ) − x 2 2 σ 2 ) = l o g ( 2 π ) 2 + l o g ( σ ) + x 2 2 σ 2 NLL(x, \mu|\sigma^2)=-log(f(x))=-log(\frac{1}{\sqrt{2\pi\sigma^2}}e^{-\frac{x^2}{2\sigma^2} })\\ = -(-log(\sqrt{2\pi\sigma^2})-\frac{x^2}{2\sigma^2})\\ =\frac{log(2\pi)}{2}+log(\sigma)+\frac{x^2}{2\sigma^2} NLL(x,μσ2)=log(f(x))=log(2πσ2 1e2σ2x2)=(log(2πσ2 )2σ2x2)=2log(2π)+log(σ)+2σ2x2

二维高斯分布的负对数似然

二维高斯分布公式展开如下
f ( x , y ) = 1 2 π ∣ ∑ ∣ e − 1 2 ( x y ) ∑ − 1 ( x y ) = 1 2 π ∣ ∑ ∣ e − 1 2 x 2 σ y 2 − 2 ρ x y σ x σ y + y 2 σ x 2 d e t ( ∣ ∑ ∣ ) = 1 2 π ∣ ∑ ∣ e − 1 2 x 2 σ y 2 − 2 ρ x y σ x σ y + y 2 σ x 2 ( 1 − ρ 2 ) σ x 2 σ y 2 = 1 2 π σ x σ y 1 − ρ 2 e − 1 2 ( 1 − ρ 2 ) ( x 2 σ x 2 − 2 ρ x y σ x σ y + y 2 σ y 2 ) \begin{align}f(x,y)&=\frac{1}{2\pi\sqrt{|\sum|}}e^{-\frac{1}{2} \begin{pmatrix}x &y\end{pmatrix}\sum^{-1}\begin{pmatrix}x \\ y\end{pmatrix}}\\ &=\frac{1}{2\pi\sqrt{|\sum|}}e^{-\frac{1}{2}\frac{x^2\sigma_y^2-2\rho xy\sigma_x\sigma_y+y^2\sigma_x^2}{det(|\sum|)}}\\ &=\frac{1}{2\pi\sqrt{|\sum|}}e^{-\frac{1}{2}\frac{x^2\sigma_y^2-2\rho xy\sigma_x\sigma_y+y^2\sigma_x^2}{(1-\rho^2)\sigma_x^2\sigma_y^2}}\\ &=\frac{1}{2\pi\sigma_x\sigma_y\sqrt{1-\rho^2}}e^{-\frac{1}{2(1-\rho^2)}(\frac{x^2}{\sigma_x^2}-\frac{2\rho xy}{\sigma_x\sigma_y}+\frac{y^2}{\sigma_y^2})} \end{align} f(x,y)=2π 1e21(xy)1(xy)=2π 1e21det()x2σy22ρxyσxσy+y2σx2=2π 1e21(1ρ2)σx2σy2x2σy22ρxyσxσy+y2σx2=2πσxσy1ρ2 1e2(1ρ2)1(σx2x2σxσy2ρxy+σy2y2)
其中,
∑ = ( σ x 2 σ x y σ x y σ y 2 ) = ( σ x 2 ρ σ x σ y ρ σ x σ y σ y 2 ) \sum = \begin{pmatrix}{\sigma_x}^2 & \sigma_{xy}\\ \sigma_{xy} &{\sigma_y}^2 \end{pmatrix} = \begin{pmatrix}{\sigma_x}^2 & \rho\sigma_x\sigma_y\\ \rho\sigma_x\sigma_y &{\sigma_y}^2 \end{pmatrix} =(σx2σxyσxyσy2)=(σx2ρσxσyρσxσyσy2)
∑ − 1 = 1 ∣ ∑ ∣ ( σ y 2 − ρ σ x σ y − ρ σ x σ y σ x 2 ) {\sum}^{-1} = \frac{1}{|\sum|}\begin{pmatrix} \sigma_y^2 & -\rho\sigma_x\sigma_y\\ -\rho\sigma_x\sigma_y &\sigma_x^2\end{pmatrix} 1=1(σy2ρσxσyρσxσyσx2)
那么负对数似然为
− l o g ( f ( x , y ) ) = − l o g ( 1 2 π σ x σ y 1 − ρ 2 e − 1 2 ( 1 − ρ 2 ) ( x 2 σ x 2 − 2 ρ x y σ x σ y + y 2 σ y 2 ) ) = − ( − l o g ( 2 π σ x σ y ) − 1 2 l o g ( 1 − ρ 2 ) + ( − 1 2 ( 1 − ρ 2 ) ( x 2 σ x 2 − 2 ρ x y σ x σ y + y 2 σ y 2 ) ) ) = l o g ( 2 π σ x σ y ) + 1 2 l o g ( 1 − ρ 2 ) + 1 2 ( 1 − ρ 2 ) ( x 2 σ x 2 − 2 ρ x y σ x σ y + y 2 σ y 2 ) \begin{align}-log(f(x,y))&=-log(\frac{1}{2\pi\sigma_x\sigma_y\sqrt{1-\rho^2}}e^{-\frac{1}{2(1-\rho^2)}(\frac{x^2}{\sigma_x^2}-\frac{2\rho xy}{\sigma_x\sigma_y}+\frac{y^2}{\sigma_y^2})})\\ &=-(-log(2\pi\sigma_x\sigma_y)-\frac{1}{2}log(1-\rho^2)+(-\frac{1}{2(1-\rho^2)}(\frac{x^2}{\sigma_x^2}-\frac{2\rho xy}{\sigma_x\sigma_y}+\frac{y^2}{\sigma_y^2})))\\ &=log(2\pi\sigma_x\sigma_y)+\frac{1}{2}log(1-\rho^2)+\frac{1}{2(1-\rho^2)}(\frac{x^2}{\sigma_x^2}-\frac{2\rho xy}{\sigma_x\sigma_y}+\frac{y^2}{\sigma_y^2}) \end{align} log(f(x,y))=log(2πσxσy1ρ2 1e2(1ρ2)1(σx2x2σxσy2ρxy+σy2y2))=(log(2πσxσy)21log(1ρ2)+(2(1ρ2)1(σx2x2σxσy2ρxy+σy2y2)))=log(2πσxσy)+21log(1ρ2)+2(1ρ2)1(σx2x2σxσy2ρxy+σy2y2)

相关文章:

  • 黑客声称窃取海量腾讯数据?数据库加密看这...
  • 零基础Opencv学习(三)
  • 制造业中的MES知识与ERP\PLM\WMS架构关系(附智能制造MES解决方案PPT下载)
  • Oracle 和 PostgreSQL 主从对比介绍
  • 【服务对接】✈️SpringBoot 项目整合华为云 obs 对象存储服务
  • Codeforces Round 969 (Div. 2)
  • npm install速度慢,install超时报错----npm换源;npm i npm install区别
  • 使用Python写贪吃蛇游戏
  • Golang | Leetcode Golang题解之第385题迷你语法分析器
  • 图形化编程系统学习10
  • 如何在知行之桥上通过业务单号查找原始报文?
  • erlang学习:用OTP构建系统3,应用程序服务器
  • SQL视图:简化复杂查询的利器
  • python——python-docx
  • ffmpeg视频转切片m3u8并加密videojs播放hls.js播放dplayer播放(弹幕效果)
  • Mysql集群
  • 大模型时代下,软件检测行业将如何发展?
  • 我问Chat GPT:怎么提交app到苹果商店审核
  • 清除系统缓存提高写盘速度的tips
  • RedisTemplate集成+封装RedisUtil
  • 关于“十五五”,在上海召开的这场座谈会释放最新信号
  • 十四届全国人大常委会第十五次会议在京闭幕
  • 这就是上海!
  • 病人有头发,照护者不发疯:《黑镜》中的身体缺席与虚伪关怀
  • 千亿市值光储龙头董事长向母校合肥工业大学捐赠1亿元
  • 民航局答澎湃:督促各单位进一步完善航班大面积延误和大面积备降应急处置预案