当前位置: 首页 > wzjs >正文

河北专业做网站wordpress 前端构建

河北专业做网站,wordpress 前端构建,中原地产,网站开发技术路线我们进行研究的时候经常会遇见偏态数据,数据转换是统计分析和数据预处理中的一项基本技术。使用 R 时,了解如何正确转换数据有助于满足统计假设、标准化分布并提高分析的准确性。在 R 中实现和可视化最常见的数据转换:对数、平方根和立方根转…

我们进行研究的时候经常会遇见偏态数据,数据转换是统计分析和数据预处理中的一项基本技术。使用 R 时,了解如何正确转换数据有助于满足统计假设、标准化分布并提高分析的准确性。在 R 中实现和可视化最常见的数据转换:对数、平方根和立方根转换。

在这里插入图片描述
为什么要转换数据?

了解数据分布
当您的数据集不满足统计分析所需的假设时(例如绘制限制立方样条或者曲线拟合不理想的时候),数据转换就变得必要。常见方案包括:

高度偏斜的分布
非线性关系
异方差性(不等方差)
非正态分布

下面咱们正式开始:
先生成两个偏态数据

# 种子
set.seed(123)# 生成两个偏态数据
right_skewed_data <- rchisq(1000, df=3)  # 右倾数据

在这里插入图片描述

count_data <- rpois(1000, lambda=5)  # 计数数据
hist(count_data,main="Original Count Data",xlab="Value",col="lightblue",breaks=30)

在这里插入图片描述
咱们可以看到上面两个数据都是偏态数据,下面进行数据转换

数据转换的类型
1. 对数变换

# 创建一个包含2行和2列的绘图窗口
par(mfrow=c(2,2))# #原始数据
hist(right_skewed_data, main="Original Right-Skewed Data",xlab="Value",col="lightblue",breaks=30)# 自然日志转换(加1处理零)
log_data <- log1p(right_skewed_data)
hist(log_data,main="Natural Log Transformed",xlab="log(x+1)",col="lightgreen",breaks=30)# Log10 转换
log10_data <- log10(right_skewed_data + 1)
hist(log10_data,main="Log10 Transformed",xlab="log10(x+1)",col="lightpink",breaks=30)# QQ日志转换数据图
qqnorm(log_data)
qqline(log_data, col="red")

在这里插入图片描述
左上图是原始数据,咱们可以看到转换后分布明显不一样

2. 平方根变换

平方根变换对于计数数据和适度的右偏度特别有效:

par(mfrow=c(2,2))# 原始数据
hist(count_data,main="Original Count Data",xlab="Value",col="lightblue",breaks=30)# 平方根转换
sqrt_data <- sqrt(count_data)
hist(sqrt_data,main="Square Root Transformed",xlab="sqrt(x)",col="lightgreen",breaks=30)# 比较分布
boxplot(count_data, sqrt_data,names=c("Original", "Square Root"),main="Distribution Comparison")# QQ 图
qqnorm(sqrt_data)
qqline(sqrt_data, col="red")

在这里插入图片描述
左上图是原始数据,咱们可以看到转换后分布明显不一样,而且箱线图看出明显差异。

3. Cube Root 转换(立方根转换)

par(mfrow=c(2,2))# 具有负值的原始数据
hist(right_skewed_data,main="Original Data (with negatives)",xlab="Value",col="lightblue",breaks=30)# Cube root 转换
cbrt_data <- sign(right_skewed_data) * abs(right_skewed_data) ^ (1/3)
hist(cbrt_data,main="Cube Root Transformed",xlab="cbrt(x)",col="lightgreen",breaks=30)# 显示密度分布
plot(density(right_skewed_data),main="Density Plot Comparison",xlab="Value")
lines(density(cbrt_data), col="red")
legend("topright", legend=c("Original", "Cube Root"),col=c("black", "red"),lty=1)# QQ 图
qqnorm(cbrt_data)
qqline(cbrt_data, col="red")

在这里插入图片描述
最后总结一下,上面三种方法侧重点不同,但是经过转换都能把偏态数据很好的转成正态分布

参考文献:https://www.r-bloggers.com/2024/12/how-to-transform-data-in-r-log-square-root-cube-root/


文章转载自:

http://rNaB2Iby.wwjft.cn
http://MFbdeqrt.wwjft.cn
http://VuzzJcsK.wwjft.cn
http://sKDs6cMB.wwjft.cn
http://AClpXXKu.wwjft.cn
http://eknli7k3.wwjft.cn
http://j5I7PEOV.wwjft.cn
http://7vJVbaHC.wwjft.cn
http://CjUKavcZ.wwjft.cn
http://2WeM437I.wwjft.cn
http://gEn48vgM.wwjft.cn
http://S1qrNjWJ.wwjft.cn
http://BTsgQfQG.wwjft.cn
http://o6OG9kE6.wwjft.cn
http://RUIgJ4Rx.wwjft.cn
http://3aqUqVpb.wwjft.cn
http://Xf3iqwwu.wwjft.cn
http://Og38ekr5.wwjft.cn
http://2NhLSrGG.wwjft.cn
http://fSipktJx.wwjft.cn
http://0XhflFOg.wwjft.cn
http://8M1x66hJ.wwjft.cn
http://SeYctNda.wwjft.cn
http://2fBRg1O3.wwjft.cn
http://KDPZFmpu.wwjft.cn
http://2DdSEUta.wwjft.cn
http://S5mWVcOP.wwjft.cn
http://o99nZbP0.wwjft.cn
http://timwHWGZ.wwjft.cn
http://RfqwmEv1.wwjft.cn
http://www.dtcms.com/wzjs/712694.html

相关文章:

  • 如何用爬虫做网站监控谷歌广告代理公司
  • 做网站是什么专业什么工作wordpress远程图片本地化插件
  • 网站页面设计与制作实践网页版微信二维码怎么扫
  • 怎样做简单公司网站wap网站 微信登录
  • 东莞网站关键排名培训机构咨询
  • 网站建设商虎小程序娱乐公司网站建设价格
  • 网站域名格式西安市建设工程信息网诚信信息平台诚信承诺书在哪儿下载
  • 茶具网站模板桥梁建设网站在哪里可以投稿
  • 免费永久网站注册wordpress 建论坛
  • 网站 建设运行情况报告wordpress删除文章数据库
  • 网站建设的建议和意见网站建设兼职在哪找
  • 想要自己做一个网站怎么做网站建设案例精粹 电子书
  • 烟台做网站的价格网站SEO优化托管
  • wordpress字段seo赚钱暴利
  • 培训机构不退钱最怕什么举报厦门seo管理
  • 做网站和推广公司商城网站 备案
  • 中国沈阳网站在哪里下载wordpress4.8.3安装
  • 衡水住房和城乡建设局网站青岛专业制作网站的公司吗
  • 如何给企业做网站网站建设有那些内容
  • 保险网站建设的目标外贸建站主机空间哪家好
  • 网站建设收费标准策划站酷网官方入口网页版
  • 网站建设越秀wordpress不能创建怎么解决方法
  • 网站建设需注意的destoon 网站搬迁
  • 大型门户网站建设哪家好秦皇岛城市建设局官网
  • 什么网站做调查能赚钱wordpress机械模板下载
  • 网站建设样板济南网站假设推广
  • 爱看视频的网站钢构网架公司
  • 2017做网站挣钱吗北京建设银行
  • 浏阳企业网站建设找人做网站被骗
  • 制作网站网站网站建设浦东