T检验(pearman)
一、相关系数的T检验原理
对于皮尔逊相关系数 ( r ),可以用T检验来判断其显著性。
零假设 H0H_0H0:两个变量之间无相关性(r=0)( r = 0)(r=0)。
1. T统计量公式
t=rn−21−r2t = \frac{r \sqrt{n-2}}{\sqrt{1 - r^2}}t=1−r2rn−2
- ( r ):样本相关系数
- ( n ):样本量
- 自由度为 ( n-2 )
2. p值计算
- 查t分布表,或用Python自动计算。
二、Python实现
假设你已经有了相关系数 r
和样本量 n
:
import numpy as np
from scipy.stats import tdef pearson_t_test(r, n):t_stat = r * np.sqrt((n - 2) / (1 - r**2))p_value = 2 * (1 - t.cdf(abs(t_stat), df=n-2)) # 双侧p值return t_stat, p_value# 以皮尔逊相关系数为例
r = pearson_bmi # 你的相关系数
n = len(df) # 样本量
t_stat, p_value = pearson_t_test(r, n)
print(f'T统计量: {t_stat:.3f}, p值: {p_value:.3g}')
三、结果解读
- 若p值 < 0.05,说明相关系数显著不为0。
- 若p值 ≥ 0.05,说明相关系数不显著。
四、补充说明
scipy.stats.pearsonr
计算的p值,其实就是用T检验方法得出的。- 斯皮尔曼相关系数的显著性检验也可以用类似方法,但通常直接用
spearmanr
的p值即可。
五、写作举例
“通过T检验,孕妇BMI与Y染色体浓度的皮尔逊相关系数为0.123,T=2.45,p=0.014,说明二者之间的线性相关性显著。”