当前位置: 首页 > news >正文

贝叶斯分类器的相关理论学习

一、贝叶斯决策

  • 条件风险

    其中 N 是总的类别标记,\lambda_{ij} 是将样本 c_j 误分类成 c_i 所产生的损失,x 是样本。

  • 总体风险

    R(h)=\mathbb{E}_x[R(h(x)\mid x)]\space.

    其中 h 为最小化总体风险的判定准则。R(h(x)\mid x) 最小了的话,那么 R(h) 就最小了,即只需要选出每个样本上条件风险最小的类别标记

    h^*(x) = \operatorname*{arg\,min}_{c \in \mathcal{Y}} R(c \mid x) \,,

    该公式被称为贝叶斯最优分类器,对应的 R(h^*) 叫做贝叶斯风险1-R(h^*) 即为分类器的最好性能。

  • 最小化分类错误率的贝叶斯最优分类器为:

    h^*(x) = \operatorname*{arg\,max}_{c \in \mathcal{Y}} P(c \mid x) \,,

    就相当于选择后验率最大的类别标记。

二、极大似然估计(结合概率论理解)

  • 通俗来说就是条件概率的连乘。

    P(D_c\mid \theta_c)=\prod_{x\in D_c}\space P(x\mid \theta_c)\space.

    和概率论中一样,由于连乘容易下溢,一般都是取对数之后在继续求极大似然。

    要求 \theta_c 的极大似然估计,就相当于就上述函数的极值。

三、朴素贝叶斯分类器

  • 基本的理解就可以完全按照概率论中的贝叶斯公式来理解,分一下离散和连续两种情况的 P(x_i\mid c) 的计算方式:

    • 离散:目标样本数 / 总样本数;

    • 连续:

      \frac{1}{\sqrt{2\pi}\sigma_{c,i}}\exp\bigg(-\frac{(x_i-\mu_{c,i})^2}{2\sigma^2_{c,i}} \bigg)\space.

    其中的理解还是与数学概率论中相同;

四、半朴素贝叶斯分类器

  • 独依赖:每个属性在各自的类别外最多依赖一个其他属性。

  • 超父属性:假设所有属性都依赖于同一个属性。

  • \text{TAN} 属性依赖:

  • \text{AODE} :是将每个属性作为超父来构建 \text{SPODE} 。

五、贝叶斯网(信念网)

  • 贝叶斯网结构上就是一个有向无环图。

  • 在网络中每个属性都和它的非后裔属性独立,其联合概率分布为:

    P_B(x_1,x_2,...,x_d)=\prod^d_{i=1}P_B(x_i\mid \pi_i)=\prod^d_{i=1}\theta_{x_i|\pi_i}\space,

    其中 \pix 的父节点。

  • 道德图:即把有向图中的所有 \text{V} 型结构的两个父节点连上,再把所有的有向边改为无向边。

  • “最小描述长度”准则:一般通常情况下我们是通过评分函数来寻找最好的贝叶斯网络(基于信息论准则),找一个以最短编码长度描述训练数据的模型。

  • 评分函数

s(B\mid D)=f(\theta)|B|-LL(B\mid D)\space,

其中,|B| 是贝叶斯网的参数个数,f(\theta) 表示描述每个参数 \theta 所需要的字节数。

:贝叶斯网在推理的时候是按照马尔科夫链的原理来的。

http://www.dtcms.com/a/289515.html

相关文章:

  • 力扣面试150(34/150)
  • 人脸识别:AI 如何精准 “认人”?
  • Florence2-通用表征完成多种视觉任务的视觉基础模型
  • 最新轻量美化表白墙系统源码v2.0 带后台版 附搭建教程
  • 分治算法---归并
  • 智能制造——48页毕马威:汽车营销与研发数字化研究【附全文阅读】
  • Muduo库中单例模式详解
  • 【Anaconda】Conda 虚拟环境打包迁移教程
  • 基于ACPs协议的智能体互联网示例(多智能体旅游规划)
  • JMeter连接数据库
  • Linux操作系统从入门到实战(十一)回车换行问题与用户缓冲区问题
  • C++虚函数易错点整理
  • 20250720-4-Kubernetes 调度-指定节点调度:nodeSelectornodeAffinity笔记
  • LeetCode 3202.找出有效子序列的最大长度 II:取模性质(动态规划)
  • JDK8默认垃圾回收器
  • (Python)类和类的方法进阶(基础教程介绍)(Python基础教程)
  • 利用核壳生物支架调控纤维 - 成骨稳态【AbMole】
  • Linux:线程控制
  • 【网络编程】网络传输-JSON
  • 【C语言】字符串与字符函数详解(下)
  • Shell脚本-cut工具
  • 从零到一MCP快速入门实战【1】
  • 疯狂星期四第13天运营日报
  • Java拓扑排序:2115 从给定原材料中找到所有可以做出的菜
  • Linux 基本指令详解
  • Self-Consistency:跨学科一致性的理论与AI推理的可靠性基石
  • WebDriver 对象中的方法
  • C++STL系列之list
  • Vue DIY 内容文本超出组件
  • Numpy库,矩阵形状与维度操作