神经网络|(十四)概率论基础知识-协方差和方差
【1】引言
前序学习进程中,已经回顾了协方差相关的基本概念。
【2】协方差正负和变量线性关系的说明
单个变量X=[x1,x2,...,xn]X=[x_{1},x_{2},...,x_{n}]X=[x1,x2,...,xn]的均值为:
E(x)=1n∑i=1nxiE(x)=\frac{1}{n}\sum_{i=1}^{n}x_{i}E(x)=n1i=1∑nxi
对于两个随机变量XXX和YYY,协方差为Cov(X,Y)Cov(X,Y)Cov(X,Y),有:
Cov(X,Y)=E[(X−E(X))(Y−E(Y))]Cov(X,Y)=E[(X-E(X))(Y-E(Y))]Cov(X,Y)=E[(X−E(X))(Y−E(Y))]
实际的机器学习中,往往不能把变量的数据全部采集到,而是只能获得一部分样本,样本协方差的计算式为:
cov(x,y)=1n−1∑i=1n(xi−xˉ)(yi−yˉ)cov(x,y)=\frac{1}{n-1}\sum_{i=1}^{n}(x_{i}-\bar x)(y_{i}-\bar y)cov(x,y)=n−11i=1∑n(xi−xˉ)(yi−yˉ)
协方差的性质满足:
若Cov(X,Y)>0Cov(X,Y)>0Cov(X,Y)>0:XXX和YYY正相关;
若Cov(X,Y)=0Cov(X,Y)=0Cov(X,Y)=0:XXX和YYY线性不相关;
若Cov(X,Y)<0Cov(X,Y)<0Cov(X,Y)<0:XXX和YYY负相关。
实际上这样判断的根本原因比较简单:
如果[(X−E(X)(Y−E(Y)]>0[(X-E(X)(Y-E(Y)]>0[(X−E(X)(Y−E(Y)]>0,包括两种情况,第一种(X−E(X)>0且(Y−E(Y)>0(X-E(X)>0且(Y-E(Y)>0(X−E(X)>0且(Y−E(Y)>0,第二种(X−E(X)<0且(Y−E(Y)<0(X-E(X)<0且(Y-E(Y)<0(X−E(X)<0且(Y−E(Y)<0,这两种情况下变量XXX和YYY同步偏离均值,所以认为它们是线性正相关关系;
如果[(X−E(X)(Y−E(Y)]=0[(X-E(X)(Y-E(Y)]=0[(X−E(X)(Y−E(Y)]=0,包括两种情况,第一种仅(X−E(X)=0(X-E(X)=0(X−E(X)=0,第二种仅(Y−E(Y)<0(Y-E(Y)<0(Y−E(Y)<0,第三种(X−E(X)=0且(Y−E(Y)=0(X-E(X)=0且(Y-E(Y)=0(X−E(X)=0且(Y−E(Y)=0,这三种情况下,变量XXX和YYY总有一个停滞在均值处,这个停滞的量和另一个量没有任何关系,所以认为它们彼此不相关;
如果[(X−E(X)(Y−E(Y)]<0[(X-E(X)(Y-E(Y)]<0[(X−E(X)(Y−E(Y)]<0,包括两种情况,第一种(X−E(X)>0且(Y−E(Y)<0(X-E(X)>0且(Y-E(Y)<0(X−E(X)>0且(Y−E(Y)<0,第二种(X−E(X)<0且(Y−E(Y)>0(X-E(X)<0且(Y-E(Y)>0(X−E(X)<0且(Y−E(Y)>0,这两种情况下变量XXX和YYY按照相反的方向偏离均值,所以认为它们是线性负相关关系。
【3】方差
我们直接从均值跳跃到协方差的计算,现在看来步子过大,在均值和协方差中间,还有一个变量,方差Var(X)Var(X)Var(X):
Var(X)=E[(X−E(X))2]=E[X2−2XE(X)+E(X)2]=E(X2)−2E(X)E(E(X))+E(E(X)2)=E(X2)−E(X)2Var(X)=E[(X-E(X))^2]=E[X^2-2XE(X)+E(X)^2]=\\ E(X^2)-2E(X)E(E(X))+E(E(X)^2)=\\ E(X^2)-E(X)^2Var(X)=E[(X−E(X))2]=E[X2−2XE(X)+E(X)2]=E(X2)−2E(X)E(E(X))+E(E(X)2)=E(X2)−E(X)2
【4】当协方差等于方差
从公式推导上看,协方差等于方差是完全可能的:当计算变量自己和自己的协方差时,协方差就是方差。
Cov(X,X)=E[(X−E(X))(X−E(X))]=E(X2)−E(X)2Cov(X,X)=E[(X-E(X))(X-E(X))]=E(X^2)-E(X)^2Cov(X,X)=E[(X−E(X))(X−E(X))]=E(X2)−E(X)2
方差其实是协方差的一个特例,协方差计算所有变量之间的相互线性关系,但方差计算的是变量自己和自己的线性关系。
【5】总结
回顾了协方差和方差的基本概念。