当前位置: 首页 > news >正文

人工智能数学基础(五):概率论

   概率论是人工智能中处理不确定性的核心工具,它为机器学习、数据科学和统计分析提供了理论基础。本文将深入浅出地介绍概率论的重要概念,并结合 Python 实例,帮助读者更好地理解和应用这些知识。资源绑定附上完整资源供读者参考学习!

5.1 概述

5.1.1 概率论的发展简史

    概率论起源于 17 世纪对赌博问题的研究,帕斯卡和费马的通信奠定了其基础。随后,贝叶斯、高斯等科学家的贡献推动了概率论的发展,使其在现代科学中广泛应用。

5.1.2 概率论的主要内容

    概率论主要研究随机现象的规律性,包括随机事件、随机变量、概率分布、期望、方差以及大数定理和中心极限定理等。

5.2 随机事件及其概率

5.2.1 随机事件的运算

   随机事件的运算包括事件的并、交、差和补集等。这些运算遵循集合运算的规则,用于构建复杂的事件。

5.2.2 随机事件的概率

    概率是衡量随机事件发生可能性大小的数值。它满足非负性、规范性和可加性三个基本性质。

5.2.3 条件概率

    条件概率是指在事件 B 发生的条件下,事件 A 发生的概率,记为 P(A|B)。其计算公式为 P(A|B) = P(AB)/P(B),其中 P(B) ≠ 0。

综合案例及应用:抛掷骰子事件

案例描述 :计算抛掷两个骰子时,点数之和大于 8 的概率。

import itertools# 生成所有可能的骰子点数组合
dice_rolls = list(itertools.product(range(1, 7), repeat=2))# 计算有利事件数目
favorable_outcomes = [roll for roll in dice_rolls if sum(roll) > 8]# 计算概率
probability = len(favorable_outcomes) / len(dice_rolls)
print("抛掷两个骰子点数之和大于 8 的概率为:", probability)

5.3 随机变量

5.3.1 随机变量的概率分布

    随机变量的概率分布描述了随机变量取各个可能值的概率规律。常见的分布包括离散型(如二项分布、泊松分布)和连续型(如正态分布、指数分布)。

5.3.2 随机变量的数字特征

    数字特征包括期望(均值)、方差和标准差,用于描述随机变量的集中趋势和离散程度。

5.3.3 常见的概率分布

  • 二项分布 :描述 n 次独立伯努利试验中成功的次数。

  • 泊松分布 :描述单位时间(或空间)内随机事件发生的次数。

  • 正态分布 :自然界中最常见的分布之一,具有钟形曲线。

  • 指数分布 :描述泊松过程中的事件发生间隔时间。

综合案例及应用:正态分布的概率计算

案例描述 :计算某地成年人身高服从均值为 170cm,标准差为 10cm 的正态分布,求身高在 160cm 到 180cm 之间的概率。

import numpy as np
import scipy.stats as stats# 正态分布参数
mu = 170  # 均值
sigma = 10  # 标准差# 计算概率
prob = stats.norm(mu, sigma).cdf(180) - stats.norm(mu, sigma).cdf(160)
print("身高在 160cm 到 180cm 之间的概率为:", prob)

5.4 贝叶斯理论

5.4.1 贝叶斯公式的推导

   贝叶斯公式是基于条件概率的逆概率计算公式,用于更新事件发生的概率。公式为 P(A|B) = P(B|A)P(A) / P(B)。

5.4.2 贝叶斯公式的应用举例

    在医学诊断、垃圾邮件过滤等领域,贝叶斯公式可用于更新事件发生的概率。例如,计算患者患病的概率。

5.4.3 贝叶斯理论的前景

    贝叶斯理论在机器学习中具有重要地位,如贝叶斯分类器、贝叶斯网络等。它为模型的不确定性和概率推理提供了有力工具。

综合案例及应用:疾病诊断

案例描述 :某疾病的发病率为 0.1%,检测该疾病的实验准确率为 99%(即患者检测为阳性的概率为 99%,非患者检测为阴性的概率为 99%)。求某人检测为阳性时患病的概率。

# 疾病发病率
p_disease = 0.001# 检测准确率
p_positive_given_disease = 0.99  # 患者检测为阳性的概率
p_negative_given_healthy = 0.99  # 非患者检测为阴性的概率# 计算贝叶斯公式中的各项
p_positive = p_disease * p_positive_given_disease + (1 - p_disease) * (1 - p_negative_given_healthy)# 计算患病概率
p_disease_given_positive = (p_positive_given_disease * p_disease) / p_positive
print("检测为阳性时患病的概率为:", p_disease_given_positive)

5.5 极限理论

5.5.1 收敛

    收敛是指随机变量序列逐渐趋近于某个值或分布的过程。包括几乎必然收敛、依概率收敛和依分布收敛等。

5.5.2 大数定理

     大数定理说明,随着试验次数增加,事件发生的频率逐渐稳定于其概率。例如,伯努利大数定理表明,事件发生的频率依概率收敛于其概率。

5.5.3 中心极限定理

    中心极限定理指出,大量独立同分布的随机变量之和近似服从正态分布。这解释了正态分布在自然现象中的普遍性

综合案例及应用:中心极限定理仿真实验

案例描述 :从均匀分布中抽取大量样本,计算样本均值,并验证中心极限定理。

import numpy as np
import matplotlib.pyplot as pltplt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False
# 抽取样本并计算均值
sample_means = []
for _ in range(10000):sample = np.random.uniform(0, 1, 100)sample_means.append(np.mean(sample))# 绘制直方图
plt.figure(figsize=(8, 6))
plt.hist(sample_means, bins=30, density=True, alpha=0.6, color='g')
plt.xlabel('样本均值')
plt.ylabel('频率')
plt.title('中心极限定理仿真实验')
plt.grid(True)
plt.show()

5.6 实验:基于 Python 的泊松分布仿真实验

5.6.1 实验目的

   理解泊松分布的特点,并掌握使用 Python 进行泊松分布模拟的方法。

5.6.2 实验要求

   生成泊松分布的随机样本,绘制其概率质量函数,并计算其期望和方差。

5.6.3 实验原理

   泊松分布用于描述单位时间(或空间)内随机事件发生的次数,其概率质量函数为 P(X=k) = λ^k e^{-λ} / k!,其中 λ 是平均发生率。

5.6.4 实验步骤

  1. 导入必要的 Python 库(NumPy 和 Matplotlib)。

  2. 设置泊松分布的参数 λ。

  3. 生成泊松分布的随机样本。

  4. 计算样本的均值和方差。

  5. 绘制泊松分布的概率质量函数。

5.6.5 实验结果

import numpy as np
import matplotlib.pyplot as plt
import scipy.stats as statsplt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False
# 设置参数
lam = 2  # 泊松分布的平均发生率
num_samples = 10000  # 生成的样本数量# 生成泊松分布的随机样本
samples = np.random.poisson(lam, num_samples)# 计算样本均值和方差
sample_mean = np.mean(samples)
sample_variance = np.var(samples)print("样本均值:", sample_mean)
print("样本方差:", sample_variance)# 绘制概率质量函数
k = np.arange(0, 10)
pmf = stats.poisson.pmf(k, lam)plt.figure(figsize=(8, 6))
plt.bar(k, pmf, align='center', alpha=0.6)
plt.xlabel('随机变量取值')
plt.ylabel('概率')
plt.title('泊松分布概率质量函数')
plt.grid(True)
plt.show()

5.7 概率论知识点表格总结

概念定义与说明常见应用
随机事件在随机试验中可能出现的结果事件的并、交、差、补集
随机变量将随机事件映射为数值的变量离散型和连续型随机变量,概率分布,期望,方差
贝叶斯公式基于条件概率的逆概率计算公式垃圾邮件过滤,疾病诊断
极限理论研究随机变量序列的收敛性和大样本性质大数定理,中心极限定理

   通过本文的学习,希望大家对概率论在人工智能中的应用有了更深入的理解。在实际操作中,多进行代码练习,可以更好地掌握这些数学工具,为人工智能的学习和实践打下坚实的基础。资源绑定附上完整资源供读者参考学习!

相关文章:

  • Android 移动开发:ProgressBar(转圈进度条)
  • C# 面向对象实例演示
  • 私有知识库 Coco AI 实战(六):打造 ES Mapping 小助手
  • C#学习第20天:垃圾回收
  • winget使用
  • UI设计之photoshop学习笔记
  • linux联接服务器SSH-局域网内网穿透分享
  • 【Java】一篇讲透Java中的集合类
  • Centos 7安装 NVIDIA CUDA Toolkit
  • Java 运算符入门指南
  • Win下的Kafka安装配置
  • 闪电贷攻击方式
  • C++(初阶)(十六)——set
  • 网络规划和设计
  • 2025年5月计划(Ue4.0shader源码抄写+ue独立游戏每天一小节)
  • 涨薪技术|0到1学会性能测试第42课-apache监控与调优
  • AI驱动视频批量智能混剪软件生产技术实践
  • README.md文档如何添加丰富多彩的badge标识,五颜六色的tag标签
  • vscode中设置eslint保存时自动格式化未生效
  • 解决vscode cmake提示检测到 #include 错误
  • 人民日报钟声:国际社会应共同维护科学溯源的正确方向
  • 国台办:相关优化离境退税政策适用于来大陆的台湾同胞
  • 游客曝九寨沟打网约车被出租车围堵,官方:前者违规,后者做法不对
  • 演员刘美含二手集市被曝售假,本人道歉
  • 西班牙葡萄牙遭遇史上最严重停电:交通瘫了,通信崩了,民众疯抢物资
  • 这场迪图瓦纪念拉威尔的音乐会,必将成为乐迷反复品味的回忆