当前位置: 首页 > news >正文

【深度学习与大模型基础】第11章-Bernoulli分布,Multinoulli分布

一、Bernoulli分布

1. 基本概念

想象你抛一枚硬币:

  • 正面朝上(记为 1)概率是 p(比如 0.6)。

  • 反面朝上(记为 0)概率是 1-p(比如 0.4)。

这就是一个Bernoulli分布:只有两种可能结果的事件(成功/失败、是/否、开/关等),且概率固定。


2. 数学表示

Bernoulli分布的概率公式:

  • P(X=1) = p (比如“硬币正面”概率)

  • P(X=0) = 1-p (比如“硬币反面”概率)


3. 机器语言例子(Python)

假设你写代码模拟一个故障的灯泡(有60%概率亮,40%概率灭):

import numpy as np

# 生成一个Bernoulli分布的样本(p=0.6)
result = np.random.binomial(n=1, p=0.6)  # n=1表示单次试验
print("灯泡状态:", "亮" if result == 1 else "灭")

运行结果可能是 (1)或 (0),多次运行会看到大约60%的情况是“亮”。


4. 为什么叫“Bernoulli”?

这是以数学家雅各布·伯努利命名的,专门用来描述这种“非黑即白”的随机事件。


5. 实际应用场景

  • 扔硬币、赌博输赢

  • 二分类问题(如邮件是垃圾邮件/非垃圾邮件)

  • 设备故障检测(正常/故障)

简单总结:Bernoulli分布就是描述一个只有两种结果的事件,且你知道每种结果的概率


二、Multinoulli分布


1. 生活场景比喻

想象你有一个 骰子(不是普通的6面骰子,而是一个各面概率可能不同的骰子):

  • 可能的结果:A面B面C面(比如分别代表“猫、狗、鸟”)

  • 每个面的概率:P(A)=0.5P(B)=0.3P(C)=0.2(总和为1)

这就是Multinoulli分布:一个事件有多个(≥2)离散结果,每个结果有固定概率


2. 和Bernoulli分布的区别

  • Bernoulli:只有两种结果(如硬币正反面)。

  • Multinoulli:多种结果(如骰子、分类任务中的类别)。


3. 数学表示

Multinoulli分布的概率公式:

  • 结果有 K 种,记为 {1, 2, ..., K}

  • 每个结果的概率为 p_{1},p_{2}...p_{k}(满足 p_{1} + p_{2} + ...p_{k} = 1)。


4. 机器学习的例子(Python)

假设你有一个图片分类模型,预测一张图片是 猫、狗、鸟 的概率分别为 [0.5, 0.3, 0.2]。用代码模拟这个分布:

import numpy as np

# 定义类别和概率
categories = ["猫", "狗", "鸟"]
probs = [0.5, 0.3, 0.2]

# 从Multinoulli分布采样一次
result = np.random.choice(categories, p=probs)
print("模型预测结果:", result)
 

运行结果可能是  或 ,多次运行会接近设定的概率比例。


5. 实际应用场景

  • 多分类问题(如手写数字识别、垃圾邮件分类)

  • 生成模型(如生成文本或图像时选择下一个词/像素)

  • 强化学习(如选择动作“左、右、跳”)


6. 和Multinomial分布的区别

  • Multinoulli:单次试验的多类别结果(如掷一次骰子)。

  • Multinomial:多次独立的Multinoulli试验(如掷多次骰子,统计各面次数)。

相关文章:

  • LeetCode 热题 100_单词拆分(86_139_中等_C++)(动态规划)
  • 【从C到C++的算法竞赛迁移指南】第五篇:现代语法糖精粹 —— 写出优雅的竞赛代码
  • 豪越消防一体化安全管控平台:构建消防“一张图”新生态
  • Java Web 300问
  • 大数据(7.4)Kafka存算分离架构深度实践:解锁对象存储的无限潜能
  • STM32基础教程——AD单通道
  • 一款安全好用的企业即时通讯平台,支持统一门户
  • 单链表各种操作实现(数据结构C语言多文件编写)
  • 中介者模式:理论、实践与 Spring 源码解析
  • MDP 值迭代算法
  • AI推理强,思维模型也有功劳【60】启发式偏差思维
  • WITRAN_2DPSGMU_Encoder 类中,门机制
  • 高级语言调用C接口(四)结构体(2)-Python
  • 如何在本地修改 Git 项目的远程仓库地址
  • 智算启新篇 安全筑新基 ——中国移动举办智算基础设施及安全分论坛
  • C++ 智能指针底层逻辑揭秘:优化内存管理的核心技术解读
  • Java 中常见的数据结构
  • 3、组件:魔法傀儡的诞生——React 19 组件化开发全解析
  • 【Python爬虫】详细入门指南
  • UNet深度学习实战遥感航拍图像语义分割
  • 德国总理默茨发表首份政府声明:将提升国防能力,全力发展经济
  • 中国科学院院士、我国航天液体火箭技术专家朱森元逝世
  • 外交部:各方应为俄乌双方恢复直接对话创造条件
  • 以军向也门3个港口的居民发布撤离令
  • “80后”德州市接待事务中心副主任刘巍“拟进一步使用”
  • 沙县小吃中东首店在沙特首都利雅得开业,首天营业额超5万元