当前位置: 首页 > news >正文

【漫话机器学习系列】188.概率相关概念详解(Notions Of Probility)

概率相关概念详解

概率论是数学的一个重要分支,用于研究随机事件的发生规律。概率的概念广泛应用于统计学、人工智能、金融、物理学等领域。本文基于图片中的信息,详细讲解概率的基本概念,包括频率解释贝叶斯定理


1. 频率解释(Frequentist Interpretation)

在概率论中,频率是用来描述某个事件在重复试验中发生的比例。即,如果我们进行大量的重复实验,某个特定事件发生的次数与实验总次数的比值可以用来估计该事件的概率。

1.1 频率的数学定义

设一个实验进行了 n 次,其中事件 A 发生了 m 次,则事件 A 的频率定义为:

f(A) = \frac{m}{n}

当试验次数 n 趋于无穷大时,这个比值趋于一个稳定的数值,即事件 A 的概率 P(A):

P(A) = \lim_{n \to \infty} \frac{m}{n}

1.2 频率解释的应用

  1. 掷硬币实验

    • 设我们掷一枚公平的硬币 n 次,其中正面朝上的次数为 m。

    • 频率 f(正面) 逐渐趋于 0.5,即:

    • 这表明,每次掷硬币的结果是随机的,但在大量实验后,正面朝上的概率会趋近于 50%。

  2. 骰子实验

    • 设我们投掷一颗六面骰子,观察 6 点朝上的概率。

    • 试验次数 n 越大,6 点朝上的频率会趋于 \frac{1}{6}

1.3 频率解释的局限性

尽管频率解释在实践中非常有用,但它有以下局限性:

  • 需要大量试验:概率的计算依赖大量重复试验,而在某些情况下无法进行足够多的实验(例如天文事件或医学实验)。

  • 无法解释单次事件的概率:频率解释无法给出单次事件(如“明天下雨”的概率)的数学意义。

  • 不适用于主观概率:有些概率(如某个足球队获胜的概率)无法通过实验反复验证。


2. 贝叶斯定理(Bayes' Theorem)

贝叶斯定理是概率论中的一个基本定理,它描述了在已知先验概率的情况下,如何通过新信息更新事件的概率。这一理论广泛应用于机器学习、人工智能、医学诊断、金融预测等领域。

2.1 贝叶斯定理的数学表达

设事件 A 和 B 是两个相关的事件,且 P(B) > 0,那么贝叶斯定理表示为:

P(A|B) = \frac{P(B|A) P(A)}{P(B)}

其中:

  • P(A∣B) :在事件 B 发生的前提下,事件 A 发生的概率(后验概率)。

  • P(B∣A) :在事件 A 发生的前提下,事件 B 发生的概率(似然度)。

  • P(A) :事件 A 发生的概率(先验概率)。

  • P(B) :事件 B 发生的概率(边际概率)。

2.2 贝叶斯定理的应用

(1) 医学诊断

假设某种疾病的患病率为 1%(先验概率 P(A)),某种检测方法的准确率为 90%(即患病者检测出阳性的概率 P(B∣A)=0.9,但该测试的误报率为 5%(健康人误检测为阳性的概率 P(B|\neg A) = 0.05

如果一个人检测结果为阳性(事件 BBB 发生),我们想知道他实际患病的概率 P(A∣B)。

根据全概率公式:

P(B) = P(B|A) P(A) + P(B|\neg A) P(\neg A)
P(B) = (0.9 \times 0.01) + (0.05 \times 0.99) = 0.059

带入贝叶斯公式:

P(A|B) = \frac{0.9 \times 0.01}{0.059} \approx 0.1525

结果:即使检测呈阳性,患者实际患病的概率仅为 15.25%! 这表明,误报率对检测结果的影响很大,在医学诊断中必须结合其他因素(如病史、进一步检测)进行分析。

(2) 机器学习

在机器学习中,贝叶斯定理被广泛应用于朴素贝叶斯分类器,该算法基于特征的条件概率来进行分类。例如:

  • 在垃圾邮件分类中,我们可以计算某封邮件包含特定词汇时,它是垃圾邮件的概率。

  • 在图像识别中,可以计算某个像素特征出现时,该图片属于某个类别的概率。


3. 频率 vs. 贝叶斯方法

方法解释适用场景
频率方法通过大量重复试验估计事件发生的概率适用于可重复试验的情况,如抛硬币、掷骰子
贝叶斯方法通过已有知识(先验概率)结合新数据进行概率更新适用于医学诊断、金融预测、机器学习等

4. 结论

  • 频率解释 强调大量重复试验的结果,适用于客观可重复的随机实验。

  • 贝叶斯定理 允许在已有信息的基础上更新概率,更适用于决策分析、医学诊断和人工智能领域。

  • 在实际应用中,这两种方法各有优劣,需根据具体问题选择合适的方法。

概率论是现代科学技术的重要基石,深入理解频率解释和贝叶斯定理,有助于更准确地分析数据、做出合理的预测和决策。

相关文章:

  • 开箱即用!推荐一款Python开源项目:DashGo,支持定制改造为测试平台!
  • MySQL、Oracle 和 PostgreSQL 是三种主流的关系型数据库的主要原理性差异分析
  • 去中心化固定利率协议
  • 【Scrapy】Scrapy教程11——XPath详解
  • MongoDB常见面试题总结(上)
  • 软件工程第四章习题
  • JavaScript/React中,...(三个连续的点)被称为 扩展运算符(Spread Operator) 或 剩余运算符(Rest Operator)
  • 【蓝桥杯2024省B】好数 三种解法全解析 | C/C++暴力法→剪枝优化→构造法演进
  • 特权FPGA之数码管
  • 一文详解OpenGL环境搭建:Ubuntu20.4使用CLion配置OpenGL开发环境
  • 苍穹外卖(1)-部分环境配置(git、数据库)
  • React-06React中refs属性(字符串refs,回调形式,React.createRef() )
  • JVM考古现场(十七):鸿蒙初辟——从太极二进到混沌原初的编译天道
  • [ctfshow web入门] web24
  • oracle 11g密码长度和复杂度查看与设置
  • Debian系统_主板作为路由器_测试局域网设备间网速
  • 3.Spring-AOP简介/AOP切入点表达式/AOP工作流程(p31-p35)
  • NO.78十六届蓝桥杯备战|数据结构-并查集|双亲表示法|初始化|查询|合并|判断|亲戚|Lake Counting|程序自动分析(C++)
  • [CI]Docker构建时传递CI的唯一生成号作为版本号(SpringBoot、Vue)
  • JVM性能调优:参数配置×内存诊断×GC调优实战
  • 网页上传和网站开发/如何在百度免费发布广告
  • 教育类手机网站模板下载/英文seo是什么
  • 织梦做的网站在手机上显示/网络营销类型有哪些
  • 网站建站平台是什么/浙江百度代理公司
  • 什么网站发布找做效果图的/整站排名
  • 网站开发 去哪里找页面/查企业信息查询平台