当前位置: 首页 > news >正文

【人工智能数学基础】如何理解方差与协方差?

文章目录

    • 一、方差:描述单个变量的离散程度
      • 1.1 核心概念
      • 1.2 数学定义
      • 1.2 具体计算公式
      • 1.3 直观理解
    • 二、协方差:描述两个变量的协同变化
      • 2.1 核心概念
      • 2.2 数学定义
      • 2.3 具体计算公式
      • 2.4 协方差的意义
    • 三、为什么可以说"第i个变量的方差"和"第i与第j个变量的协方差"?
      • 3.1 数据表的视角
      • 3.2 "第i个变量的方差"
      • 3.3 "第i个变量与第j个变量的协方差"
    • 四、协方差矩阵:将所有关系整合在一起
      • 4.1 定义
      • 4.2 重要性质
    • 五、实际例子
    • 总结

一、方差:描述单个变量的离散程度

1.1 核心概念

方差衡量的是一个随机变量或数据集与其平均值的偏离程度。它描述了数据的"波动性"或"分散程度"。

1.2 数学定义

对于随机变量X,其方差定义为:
Var(X)=E[(X−E[X])2]\text{Var}(X) = E[(X - E[X])^2] Var(X)=E[(XE[X])2]
其中E[X]E[X]E[X]XXX的期望值(均值)。

1.2 具体计算公式

样本方差
s2=1n−1∑i=1n(xi−xˉ)2s^2 = \frac{1}{n-1} \sum_{i=1}^{n} (x_i - \bar{x})^2 s2=n11i=1n(xixˉ)2

字母含义

  • ( n ):样本数量
  • ( x_i ):第i个观测值
  • ( \bar{x} ):样本均值
  • ( s^2 ):样本方差

1.3 直观理解

  • 方差大:数据点分散,波动剧烈
  • 方差小:数据点集中,波动平缓

二、协方差:描述两个变量的协同变化

2.1 核心概念

协方差衡量的是两个随机变量变化的协同关系。它描述了两个变量是"同向变化"还是"反向变化"。

2.2 数学定义

对于随机变量X和Y,协方差定义为:
Cov(X,Y)=E[(X−E[X])(Y−E[Y])]\text{Cov}(X,Y) = E[(X - E[X])(Y - E[Y])] Cov(X,Y)=E[(XE[X])(YE[Y])]

2.3 具体计算公式

样本协方差
sxy=1n−1∑i=1n(xi−xˉ)(yi−yˉ)s_{xy} = \frac{1}{n-1} \sum_{i=1}^{n} (x_i - \bar{x})(y_i - \bar{y}) sxy=n11i=1n(xixˉ)(yiyˉ)

2.4 协方差的意义

  • 正值:X和Y倾向于同向变化(一个增加,另一个也增加)
  • 负值:X和Y倾向于反向变化(一个增加,另一个减少)
  • :X和Y没有线性关系

三、为什么可以说"第i个变量的方差"和"第i与第j个变量的协方差"?

3.1 数据表的视角

考虑一个典型的数据集:

样本变量1 (身高)变量2 (体重)变量3 (年龄)变量p
1x₁₁x₁₂x₁₃x₁ₚ
2x₂₁x₂₂x₂₃x₂ₚ
3x₃₁x₃₂x₃₃x₃ₚ
nxₙ₁xₙ₂xₙ₃xₙₚ

在这个数据表中:

  • 代表不同的观测样本
  • 代表不同的变量

3.2 “第i个变量的方差”

当我们说"第i个变量的方差"时:

  • 我们固定列索引i
  • 计算这一列所有数据的方差
  • 公式:Var(Xi)=1n−1∑k=1n(xki−xˉi)2\text{Var}(X_i) = \frac{1}{n-1} \sum_{k=1}^{n} (x_{ki} - \bar{x}_i)^2Var(Xi)=n11k=1n(xkixˉi)2
  • 其中xˉi\bar{x}_ixˉi是第i列(第i个变量)的均值

例子:"第2个变量的方差"就是计算体重这一列数据的方差。

3.3 “第i个变量与第j个变量的协方差”

当我们说"第i个变量与第j个变量的协方差"时:

  • 我们固定两个列索引i和j
  • 计算这两列数据之间的协方差
  • 公式:Cov(Xi,Xj)=1n−1∑k=1n(xki−xˉi)(xkj−xˉj)\text{Cov}(X_i, X_j) = \frac{1}{n-1} \sum_{k=1}^{n} (x_{ki} - \bar{x}_i)(x_{kj} - \bar{x}_j)Cov(Xi,Xj)=n11k=1n(xkixˉi)(xkjxˉj)

例子:"第1个变量与第2个变量的协方差"就是计算身高和体重这两列数据的协方差。


四、协方差矩阵:将所有关系整合在一起

4.1 定义

协方差矩阵Σ\SigmaΣ是一个p×pp×pp×p的对称矩阵,包含了所有变量之间的方差和协方差信息:

Σ=[Var(X1)Cov(X1,X2)⋯Cov(X1,Xp)Cov(X2,X1)Var(X2)⋯Cov(X2,Xp)⋮⋮⋱⋮Cov(Xp,X1)Cov(Xp,X2)⋯Var(Xp)]\Sigma = \begin{bmatrix} \text{Var}(X_1) & \text{Cov}(X_1,X_2) & \cdots & \text{Cov}(X_1,X_p) \\ \text{Cov}(X_2,X_1) & \text{Var}(X_2) & \cdots & \text{Cov}(X_2,X_p) \\ \vdots & \vdots & \ddots & \vdots \\ \text{Cov}(X_p,X_1) & \text{Cov}(X_p,X_2) & \cdots & \text{Var}(X_p) \end{bmatrix} Σ=Var(X1)Cov(X2,X1)Cov(Xp,X1)Cov(X1,X2)Var(X2)Cov(Xp,X2)Cov(X1,Xp)Cov(X2,Xp)Var(Xp)

4.2 重要性质

  1. 对角线元素:就是各个变量的方差
    Σii=Var(Xi)\Sigma_{ii} = \text{Var}(X_i) Σii=Var(Xi)
  2. 非对角线元素:就是变量间的协方差
    Σij=Cov(Xi,Xj)(i≠j)\Sigma_{ij} = \text{Cov}(X_i, X_j) \quad (i \neq j) Σij=Cov(Xi,Xj)(i=j)
  3. 对称性Σij=Σji\Sigma_{ij} = \Sigma_{ji}Σij=Σji

五、实际例子

假设我们有3个变量:身高(X₁)、体重(X₂)、年龄(X₃),测量了100个人。

  • “第1个变量的方差”:计算100个人的身高的方差
  • “第2个变量的方差”:计算100个人的体重的方差
  • “第1个与第2个变量的协方差”:计算身高和体重的协方差(预期为正,因为高的人通常更重)
  • “第1个与第3个变量的协方差”:计算身高和年龄的协方差(可能接近零,因为成人身高基本稳定)

协方差矩阵:
Σ=[Var(身高)Cov(身高,体重)Cov(身高,年龄)Cov(体重,身高)Var(体重)Cov(体重,年龄)Cov(年龄,身高)Cov(年龄,体重)Var(年龄)]\Sigma = \begin{bmatrix} \text{Var}(身高) & \text{Cov}(身高,体重) & \text{Cov}(身高,年龄) \\ \text{Cov}(体重,身高) & \text{Var}(体重) & \text{Cov}(体重,年龄) \\ \text{Cov}(年龄,身高) & \text{Cov}(年龄,体重) & \text{Var}(年龄) \end{bmatrix} Σ=Var(身高)Cov(体重,身高)Cov(年龄,身高)Cov(身高,体重)Var(体重)Cov(年龄,体重)Cov(身高,年龄)Cov(体重,年龄)Var(年龄)


总结

  1. 方差描述单个变量的离散程度
  2. 协方差描述两个变量的协同变化关系
  3. "第i个变量"的表述源于我们将数据视为矩阵,其中列代表变量
  4. 协方差矩阵系统性地组织了所有变量间的方差和协方差关系
http://www.dtcms.com/a/546663.html

相关文章:

  • 那个网站可以做学历认证女装网站模板
  • Modbus Simulator
  • 网页设计网站期末作业石河子做网站
  • 温岭做网站的公司有哪些网页设计尺寸怎么测量
  • 怎么做网络乞丐网站在putty上怎样安装wordpress
  • 无锡网站建设818gx家装室内设计
  • 网站建设需要洽谈什么在centos上搭建wordpress
  • 域名代理商网站西安优秀的集团门户网站建设公司
  • 宠物出售的网站怎么做网站扁平化设计风格
  • MySQL 复合查询全解析:从单表到多表的实战进阶
  • 从0开始学Java--day7--类与对象-初
  • 用c 可以做网站吗做资讯类网站
  • 庄行网站建设免费wordpress中文主题
  • 深圳网站设计 制作wordpress评论框插件
  • 深圳培训网站开发山东省建设厅网站地址
  • 江苏网站开发建设多少钱服装公司网站多少钱
  • 网站建设进度计划表优享揭阳网站建设
  • 标准化信息网站建设与应用网站做多长时间才会成功
  • matlab示例
  • 做文案的网站有些什么建设网站人员名单
  • 公司名称 网站域名 关联常州模板网站建设价位
  • 网站3d特效源码电子商务网站建设与维护代码
  • 学生制作个人网站湖南建设监理报名网站
  • 有免费的微网站是什么上海的网站设计公司
  • 工信部网站备案注销网站广告推广怎么做的
  • Linux小课堂: 系统救援模式操作指南:修复启动问题与重置Root密码
  • 利用不坑盒子在WPS中插入网页,放映的电脑无需安装插件,直接就能显示网页!
  • 济南网络建站企业网站推广的策略有哪些
  • 南昌建网站那家好乐享黔程是什么公司
  • Vue 中 <keep-alive> 功能介绍,使用场景,完整使用示例演示