当前位置: 首页 > news >正文

从0开始学习R语言--Day15--非参数检验

非参数检验

如果在进行T检验去比较两组数据差异时,假如数据里存在异常值,会把数据之间的差异拉的很大,影响正常的判断。那么这个时候,我们可以尝试用非参数检验的方式来比较数据。

假设我们有A,B两筐苹果,我们并不知道重量具体是多少,且看着苹果有很多不同大小,有的异常大,有的特别小。此时,我们先对两筐苹果做上属于各自的A、B标记,然后混在一起,通过天平比较大小,也就是对苹果重量做个排名。然后计算各自分组的所有苹果的排名总和,并计算检验统计量U_{A} = R_{A} - \frac{n_{A}(n_{A}+1)}{2}U_{B} = R_{B} - \frac{n_{B}(n_{B}+1)}{2}U = min(U_{A},U_{B})

将求得的U与以两组苹果数量为基础查的查曼-惠特尼U检验临界值表的U做对比,如果小于后者,则说明两组苹果存在差异。

下面我们用一组例子来说明:

set.seed(123)# A筐苹果:偏重的苹果(大部分在150g-300g)
apple_A <- round(runif(10, min=150, max=300), 1)# B筐苹果:偏轻的苹果(大部分在100g-200g)
apple_B <- round(runif(10, min=100, max=200), 1)# 创建数据框
fruit_data <- data.frame(weight = c(apple_A, apple_B),basket = rep(c("A", "B"), each=10)  # 标记属于哪一筐
)# 查看数据
print(fruit_data)boxplot(weight ~ basket, data=fruit_data, col=c("lightgreen", "orange"),main="两筐苹果的重量对比")wilcox.test(weight ~ basket, data=fruit_data)

输出:

	Wilcoxon rank sum exact testdata:  weight by basket
W = 93, p-value = 0.0004871
alternative hypothesis: true location shift is not equal to 0

从输出中可以看到,首先根据箱线图判断,因为明显不重叠,所以判断出两组数据可能存在差异。此时我们进一步计算,由于p=0.0004871 ,小于等于0.05,从而可以确定存在显著的差异,而不是因为异常值导致的差异。

相关文章:

  • 深度学习pycharm debug
  • 碳中和新路径:铁电液晶屏如何破解高性能与节能矛盾?
  • C++.cstring string
  • 渗透测试之信息搜集
  • 第1篇:数据库中间件概述:架构演进、典型方案与应用场景
  • React 组件异常捕获机制详解
  • Linux --TCP协议实现简单的网络通信(中英翻译)
  • vite构建工具
  • 吴恩达MCP课程(5):mcp_chatbot_prompt_resource.py
  • K-匿名模型
  • 面向连接的运输:TCP
  • 基于 Android 和 JBox2D 的简单小游戏
  • Android高级开发第三篇 - JNI异常处理与线程安全编程
  • 用 Whisper 打破沉默:AI 语音技术如何重塑无障碍沟通方式?
  • HTTP、WebSocket、SSE 对比
  • CNN卷积网络:让计算机拥有“火眼金睛“(superior哥AI系列第4期)
  • 打卡day43
  • 秋招Day12 - 计算机网络 - UDP
  • 05.MySQL表的约束
  • 如何区分虚拟货币诈骗与经营失败?
  • wordpress 图片不显示/福建seo网站
  • 网站建设属于什么行业/优化公司结构
  • 我要啦免费统计怎么做网站/网上教育培训机构
  • 做游戏装备网站可以吗/seo服务销售招聘
  • 期货网站做模拟/网站换了域名怎么查
  • 个人怎么做网站推广/十大跨境电商erp排名