当前位置: 首页 > news >正文

【机器学习-基础知识】统计和贝叶斯推断

1. 概率论基本概念回顾

1. 概率分布

定义: 概率分布(Probability Distribution)指的是随机变量所有可能取值及其对应概率的集合。它描述了一个随机变量可能取的所有值以及每个值被取到的概率。

  • 对于离散型随机变量,使用概率质量函数来描述。
  • 对于连续型随机变量,使用概率密度函数来描述。

举例说明: 投掷一颗六面骰子,每个面上的数字(1到6)都有相同的概率(1/6)出现,这就是一个简单的概率分布例子。

2. 概率函数

定义: 概率函数(Probability Function)是指在离散型随机变量的情况下,给定一个随机变量的值时,计算该值发生的概率的函数。

公式: 对于离散型随机变量 X X X,其概率函数通常表示为 P ( X = x ) P(X=x) P(X=x),即随机变量 X X X 取某个特定值 x x x 的概率。

举例说明: 抛一枚公平的硬币,令 X X X 表示出现正面的情况,则 P ( X = 正面 ) = 0.5 P(X=\text{正面})=0.5 P(X=正面)=0.5

3. 概率分布函数(累积分布函数)

定义: 概率分布函数(Cumulative Distribution Function, CDF),也称作累积分布函数,是一个函数,它给出随机变量小于或等于某个值的概率。

公式: 对于任意实数 a a a,CDF F ( a ) = P ( X ≤ a ) F(a) = P(X \leq a) F(a)=P(Xa)

举例说明: X X X 为一个均匀分布在 [ 0 , 1 ] [0,1] [0,1] 区间上的随机变量,则 F ( x ) F(x) F(x) 对于 0 ≤ x ≤ 1 0 \leq x \leq 1 0x1 x x x,即 F ( x ) = x F(x) = x F(x)=x

在这里插入图片描述

4. 概率密度函数

定义: 概率密度函数(Probability Density Function, PDF)适用于连续型随机变量,用来描述连续型随机变量落在某个确定值附近的概率密度大小。

公式: 对于连续型随机变量 X X X,其PDF记为 f ( x ) f(x) f(x),满足条件:
∫ − ∞ ∞ f ( x ) d x = 1 \int_{-\infty}^{\infty} f(x)dx = 1 f(x)dx=1
并且对于任意两个实数 a a a b b b ( a < b a < b a<b),随机变量 X X X 落在区间 [ a , b ] [a, b] [a,b] 内的概率由下面积分给出:
P ( a < X ≤ b ) = ∫ a b f ( x ) d x P(a < X \leq b) = \int_{a}^{b} f(x) dx P(a<Xb)=abf(x)dx

2. 统计和贝叶斯

贝叶斯公式

定义: 贝叶斯公式(Bayes’ Theorem)是一种计算条件概率的方法,它允许我们通过已知的某些条件下的事件发生的概率来更新对另一些条件下该事件发生概率的估计。

公式:
P ( A ∣ B ) = P ( B ∣ A ) ⋅ P ( A ) P ( B ) P(A|B) = \frac{P(B|A) \cdot P(A)}{P(B)} P(AB)=P(B)P(BA)P(A)
其中,

  • P ( A ∣ B ) P(A|B) P(AB) 是在事件 B 发生的情况下事件 A 发生的概率,称为后验概率
  • P ( B ∣ A ) P(B|A) P(BA) 是在事件 A 发生的情况下事件 B 发生的概率,称为后验概率
  • P ( A ) P(A) P(A) P ( B ) P(B) P(B) 分别是事件 A 和事件 B 的边际概率(无条件概率) P ( A ) P(A) P(A) 也被称为先验概率

全概率公式

定义: 全概率公式(Law of Total Probability)提供了一种方法,用于计算一个复杂事件的概率,特别是当这个事件可以被分解为几个互斥但又完全覆盖样本空间的子事件时。

公式:
如果 B 1 , B 2 , . . . , B n B_1, B_2, ..., B_n B1,B2,...,Bn 是一组互斥且穷尽的事件(即它们之间没有交集,但并集覆盖了整个样本空间),则对于任意事件 A,有
P ( A ) = ∑ i = 1 n P ( A ∣ B i ) ⋅ P ( B i ) P(A) = \sum_{i=1}^{n} P(A|B_i) \cdot P(B_i) P(A)=i=1nP(ABi)P(Bi</

相关文章:

  • Flutter_学习记录_device_info_plus 插件获取设备信息
  • 12 | 给应用添加优雅关停功能
  • Webpack 优化深度解析:从构建性能到输出优化的全面指南
  • Vue项目上传到GitHub,vscode拉取vue项目更新后推送到GitHub上
  • vllm.LLM 的参数
  • Linux——进程初步
  • FI模块功能范围的基本概念、用途、配置介绍
  • java登神之阶之顺序表
  • SpringAI+Ollama+DeepSeek本地大模型调用
  • yolov8在昇腾芯片上的测试
  • ESP32-S3-WROOM-1-N16R8 微控制器,搭配 SI4732-A10-GSR 的收音机(源码+PCB+3D模型)
  • libpcap捕捉过滤wifi beacon包解析国标飞行器drone id报文
  • Machine Learning: 十大基本机器学习算法
  • vue3在ts中动态添加DOM(1、使用render函数,2、使用tsx)
  • 【抽奖项目】|第二篇
  • 环境配置 | 5分钟极简Git入门:从零上手版本控制
  • vb编程有哪些相关的IDE开发工具vb.net,Basic语言?
  • JVM常用概念之常量
  • zsh: command not found: adb 报错问题解决
  • mac 苍穹外卖 前端环境配置
  • 竞彩湃|德甲欧冠资格竞争白热化,伯恩茅斯主场迎恶战
  • 重庆大学通报本科生发14篇SCI论文:涉事学生及其父亲被处理
  • 西甲上海足球学院揭幕,用“足球方法论”试水中国青训
  • 长三角地区中华老字号品牌景气指数发布,哪些牌子是你熟悉的?
  • 七大交响乐团“神仙斗法”,时代交响在上海奏出时代新声
  • 国家主席习近平同普京总统举行小范围会谈