【干货】《基础统计学》(第13章):非参数检验方法
目录
1 非参数检验的基本方法
2 符号检验
3 威尔科克森符号秩检验
4 威尔科克森秩和检验
5 Kruskal-Wallis检验
6 秩相关性检验
7 游程检验
原文链接:https://mp.weixin.qq.com/s/pcOfh4v8DqAgiYSM2KI_oA
1 非参数检验的基本方法
参数检验要求样本服从某一特定的总体分布,而非参数检验则不涉及有关总体分布的参数;因此,非参数检验又被称为“不受分布限制检验”
优势和劣势
非参数检验的优势
-
一般参数检验必须满足的条件,在非参数检验中并不严格要求满足,所以非参数检验的适用范围更为广泛
-
非参数检验适用的数据类型要比参数检验的多,例如排名/等级,或者分类数据(如性别)
非参数检验的劣势
-
非参数检验通常把定量数据转换为定性数据,从而浪费了部分信息
-
非参数检验的“效率”较低,因此通常需要更多的证据(如更大的样本或更大的差异)用于拒绝原假设
非参数检验的效率:当满足特定分布的条件时,非参数检验的效率一般低于相应的参数检验
秩次
数据可以通过某种准则进行排序,比如从小到大或者从好到坏,秩次(或称秩)是根据单个样本值在排序列表中的顺序为其分配的一个数字,规定排序后的第一个样本值的秩次为1,第二个样本值的秩次为2,以此类推
平均秩次:如果数据值相等,则一般会取其平均秩次,并将该平均秩次分配给所有相等的数据值
例如:
2 符号检验
符号检验的大致过程是先将数据值转换为正负符号,再检验其中一个符号的个数是否显著高于另一个符号的个数
符号检验是指通过使用正负符号对如下类型的命题进行假设检验:
-
配对样本
-
具有两个分类的名目数据
-
单个总体的中位数
符号检验的基本思想是通过分析正符号和负符号的频数,以确定两者是否显著不同
符号检验
目标
对如下类型的命题进行符号检验
-
配对样本:计算每对数据的差值,记录差值的符号并舍去所有差值为 0 的数据
-
具有两个分类的名目数据:将其中一类归为正符号,另一类归为负符号
-
单个总体的中位数:高于中位数的数据符号为正,低于中位数的数据符号为负,并舍去所有等于中位数的数据
条件
-
样本数据是简单随机样本(注意:没有限制样本来自何种分布)
检验统计量
-
如果 n≤25,那么检验统计量为 x
-
如果 n>25,那么检验统计量计算如下(连续性修正):
$$z = \frac{(x+0.5)-(n/2)}{\sqrt{n}/2}$$
其中,n=所有正负符号的个数,x=符号出现较少那一组的个数
p 值:使用统计软件或z检验统计量
临界值:查询统计表
配对样本
在进行配对样本的符号检验时,通过以下步骤将原始数据转换成正负符号
1.计算每对样本值的差值
2.记录所得差值的符号,并舍去所有差值为0的数据
该检验的核心概念是:如果两组数据的中位数相同,那么正负差值的个数应该近似相等
当n>25时,检验统计量的基本原理
在统计表中只能找到 n≤25 对应的临界值,当 n>25 时,检验统计量 z 的计算是基于二项分布的正态近似法的
当 np≥5 和 nq≥5 同时得到满足时,可以使用正态分布来近似二项分布,假设在符号检验中 p=q=1/2,因此只要满足 n≥10,np≥5 和 nq ≥5 就能同时得到满足
二项分布的均值为,
,所以有
,
,将其代入标准 z 分数公式中,则有:
$$z = \frac{x-\mu}{\sigma}=\frac{x-(n/2)}{\sqrt{n}/2}$$
x 的值为离散数据,而正态分布为连续性分布,此处使用连续性修正,但区别在于,x 代表符号出现较少那一组的个数,所以保守的做法是只考虑x+0.5,因此,最后的检验统计量 z 为
$$z = \frac{(x+0.5)-(n/2)}{\sqrt{n}/2}$$
3 威尔科克森符号秩检验
威尔科克森符号秩检验(Wilcoxon Signed-Ranks Test)作为一种非参数检验,可被应用的场景如下:
-
检验配对样本对应的总体的差值中位数是否等于0
-
检验单个总体的中位数是否等于某个值
配对样本
符号检验仅使用了配对样本中差值符号的信息,而威尔科克森符号秩检验使用了秩次,没有使用符号;因此,符号秩检验考虑了差值大小的信息,从而使其检验结果能够更好地反映数据的真实性
威尔科克森符号秩检验
目标
对如下类型的命题进行威尔科克森符号秩检验
-
配对样本:检验配对样本对应的总体的差值中位数是否等于0
-
单个总体的中位数:检验总体的中位数是否等于某个值
条件
-
样本数据是简单随机样本
-
差值的总体分布近似于对称(如果是单个总体,那么其差值为该特定值与每个样本值之差;如果是配对样本,那么其差值为配对样本的两个样本值之差)
(注意:没有限制样本来自何种分布)
检验统计量
如果 n ≤ 30,那么检验统计量为 T
$$T = \min(|T_-|,|T_+|)$$
其中,为非零差值 d 的正秩和,
为非零差值 d 的负秩和
如果 n>30,那么检验统计量计算如下:
$$z= \frac{T-\frac{n(n+1)}{4}}{\sqrt{\frac{n(n+1)(2n+1)}{24}}}$$
p 值:使用统计软件,或者使用 z 检验统计量和统计表
临界值:使用统计表
威尔科克森符号秩检验的步骤:
步骤1:求每对数据的差值 d,并舍去所有为 0 的差值
步骤2:按 |d| 升序排列,若 |d| 相等,则取其平均秩次
步骤3:将 d 的正负符号添加至|d| 的秩次中
步骤4:分别求正秩和的绝对值(|$$T_+$$|)以及负秩和的绝对值(|$$T_-$$|)
步骤5:求
步骤6:设 n 为所有差值不为0的样本对数
步骤7:求检验统计量以及临界值
步骤8:若检验统计量落在临界域内(即检验统计量小于或等于临界值),则拒绝原假设;否则,不能拒绝原假设
单个总体的中位数
只需对上述检验步骤进行简单调整,即可将威尔科克森符号秩检验应用于单个总体的情况:当检验单个总体的中位数是否等于某个值时,通过将该值与每个样本值进行一一配对,就可以上述检验步骤
秩和即 1+2+3+...+n=n(n+1)/2;另外,如果秩和能被均匀地分为正负两组,那么正秩和与负秩和都为n(n+1)/2的一半,即 (n+1)/4;这两个表达式就是当n>30时,z 的分子和分母的由来
4 威尔科克森秩和检验
威尔科克森秩和检验通过两个独立样本的秩次来检验两个独立总体的中位数是否相同
威尔科克森秩和检验等价于曼-惠特尼U检验(Mann-Whitney U Test)
威尔科克森秩和检验的基本思想:如果两个样本来自两个相同的总体,那么将所有的样本值排序并合并为一组值后,秩次的高低应该均匀地分布在两个样本中,如果较低的秩次主要出现在一个样本中,而较高的秩次主要出现在另一个样本中,那么就表明两个总体的中位数并不相同
与两个独立样本的 t 检验不同,威尔科克森秩和检验不需要具有正态分布的总体,并且可以被用于次序尺度下的数据,例如由等级组成的数据
由于威尔科克森秩和检验具有很高的效率得分且易于计算,即使在满足正态性的条件下,它也往往优于 t 检验
威尔科克森秩和检验为非参数检验,该检验通过样本数据的秩次来检验两个独立总体的中位数是否相同
威尔科克森秩和检验
目标
-
检验两个独立总体的中位数是否相同
条件
-
两个样本相互独立且都是简单随机样本
-
每个样本的样本量大于10
(注意:没有限制样本来自何种分布)
检验统计量
$$z=\frac{R-\mu_R}{\sigma_R}$$
其中,R 在原假设下的均值
$$\mu_R = \frac{n_1(n_1+n_2+1)}{2}$$
R 在原假设下的标准差
$$\sigma_R = \sqrt{\frac{n_1n_2(n_1+n_2+1)}{12}}$$
p 值:使用统计软件,或者使用 z 检验统计量和统计表
临界值:使用统计表
求检验统计量的过程
步骤1:将两个样本合并并按升序计算秩次;如果数据值相等,则取其平均秩次
步骤2:分别求出两个样本的秩和
步骤3:根据检验统计量计算 z
5 Kruskal-Wallis检验
假设有3个或3个以上相互独立的简单随机样本,Kruskal-Wallis检验(又称为H 检验)根据上述样本合并后的秩次,检验样本是否都来自中位数相同的总体
如果每个样本都至少有5个观测值,那么Kruskal-Wallis检验中的检验统计量 H 所对应的分布近似于卡方分布;H 度量不同样本的秩和的方差
如果秩次均匀分布在每组样本中,那么 H 值相对较小;反之,如果样本间差异较大,那么一些组中的秩次就会过低,而另一些组中的秩次就会过高,从而导致 H 值偏大;而只有偏大的 H 值会让我们拒绝原假设,因此 Kruskal-Wallis检验为右侧检验
Kruskal-Wallis检验
目标
-
检验3个或3个以上总体的中位数是否相同
条件
-
至少有3个相互独立的简单随机样本
-
每个样本都至少有5个观测值
(注意:没有限制样本来自何种分布)
检验统计量
$$H= \frac{12}{N(N+1)}(\frac{R_1^2}{n_1}+\frac{R_2^2}{n_2}+...+\frac{R_k^2}{n_k})-3(N+1)$$
其中,N 为所有样本合并后的观测个数,k为所有样本的个数,n为样本量,R为样本的秩和
p 值:使用统计软件,或者使用 z 检验统计量和统计表
临界值:使用统计表
求 H 检验统计量的过程
步骤1:将所有样本合并并按升序计算秩次;如果数据值相等,则取其平均秩次
步骤2:分别求得每个样本的样本量以及秩和
步骤3:根据检验统计量,计算 H
6 秩相关性检验
秩相关性检验(又称为斯皮尔曼秩相关性检验)是通过配对样本的秩次来检验两个变量之间的相关性
为了与线性相关系数 r 相区别,秩相关系数记作,使用下标s是为了纪念首先提出秩相关性概念的查尔斯・斯皮尔曼(Chalres Spearman),因此r,也被称为斯皮尔曼秩相关系数
秩相关性检验
目标
通过秩相关系数$$r_s$$来检验两个变量之间的相关性
(不存在相关性)
(存在相关性)
这里为配对样本总体的秩相关系数
条件
给定一组成对数据,对相关系数的计算没有任何限制,但是,当使用成对数据来推断其总体的线性相关性时,应当满足以下条件:
-
配对样本是简单随机样本
-
数据值是秩次,或者可以转换为秩次
(注意:没有限制样本必须服从二元正态分布)
计算$$r_s$$的公式
将样本值转换为秩次后
$$r_s= \frac{n(\Sigma xy)-(\Sigma x)(\Sigma y)}{\sqrt{n(\Sigma x^2)-(\Sigma x)^2}\sqrt{n(\Sigma y^2)-(\Sigma y)^2}}$$
如果两个变量各自的秩次都不相等,则可以使用以下简化公式:
$$r_s = 1-\frac{6\Sigma d^2}{n(n^2-1)}$$
p 值:通过软件(注意:请使用通过斯皮尔曼秩相关性检验的 p 值,而不是使用通过秩次的线性相关性检验的p值)
临界值:如果n≤30,则使用统计表;如果n>30,则使用以下公式
$$r_s = \frac{±z}{\sqrt{n-1}}$$
其中,z 的值与显著性水平相对应
秩相关性检验的优点:
-
秩相关性检验不需要样本服从正态分布
-
秩相关性检验可以检测出部分(不是全部)非线性关系
秩相关性检验的缺点:秩相关性检验的效率得分只有0.91
使用线性相关性检验无法检测出非线性相关性,而使用秩相关性检验有时可以检测出非线性相关性
7 游程检验
将每个数据值都分类为两个类别之一之后,一个游程是指连续出现同一类别的区段;在该区段之后,可以有另一个类别的区段或者没有数据
游程检验(或称为连贯检验)根据样本数据中游程出现的次数判断数据是否来自随机过程
游程检验的基本原理
如果游程的总数过高或者过低,那么拒绝数据来自随机过程
游程检验
目标
检验样本数据的序列是否具有随机顺序
H0:样本数据来自随机过程
H1:样本数据并非来自随机过程
条件
样本数据按照某种排序方案排列,例如样本值的获取顺序
每个数据值都可以被分类为两个类别之一(比如男性/女性)
检验统计量与临界值
小样本(n1≤20,n2≤20)并且α=0.05:
-
检验统计量:游程总数 G
-
临界值:使用统计表
-
做出判断:如果 G 落在两个临界值以外,那么拒绝样本数据来自随机过程
大样本(n1>20,n2>20)并且α≠0.05:
检验统计量
$$z =\frac{G-\mu_G}{\sigma_G}$$
其中
$$\mu_G = \frac{2n_1n_2}{n_1+n_2}+1$$
$$\mu_G = \sqrt{\frac{(2n_1n_2)(2n_1n_2-n_1-n_2)}{(n_1+n_2)^2(n_1+n_2-1)}}$$
-
临界值:使用统计表
-
做出判断:如果 z 落在两个临界值以外,那么拒绝样本数据来自随机过程
检测高于或低于均值(或中位数)的随机性
有些序列可以自然地分为两个类别,可以使用游程检验来判断定量数据在其均值或中位数上下波动的随机性
以中位数为例,将高于中位数的值标记为A,低于中位数的值标记为B,并删除所有等于中位数的值,然后,按照以上描述的步骤进行游程检验
【往期回顾】
【干货】《基础统计学》(第3章):描述与探索数据
【干货】《基础统计学》(第5/6章):离散概率分布和正态分布
【干货】《基础统计学》(第7章):参数估计和样本量确定
【干货】《基础统计学》(第8章):假设检验
【干货】《基础统计学》(第9章):两个样本的统计推断
【干货】《基础统计学》(第10章):相关分析与回归分析
【干货】《基础统计学》(第11章):拟合优度与列联表