当前位置: 首页 > wzjs >正文

创造与魔法官网站_一起做喜欢的事怎么让关键词快速上首页

创造与魔法官网站_一起做喜欢的事,怎么让关键词快速上首页,台州椒江区热销企业网站搭建,国外无版权素材网站在一般情况下,我们都是在数据分析的需求前提下去选择使用R语言。而实际上,数据分析里,百分之八十的工作,都是在数据清洗。并不只是我们平时会提到的异常值处理或者是整合格式,更多会涉及到将各种各样的数据整合&#x…

在一般情况下,我们都是在数据分析的需求前提下去选择使用R语言。而实际上,数据分析里,百分之八十的工作,都是在数据清洗。并不只是我们平时会提到的异常值处理或者是整合格式,更多会涉及到将各种各样的数据整合,按照要求去除掉不合规的数据,再并到一起形成一个纯净的,可利用的数据,甚至有些时候还需要进行脱敏操作,防止对后续模型训练之类的影响,下面我来介绍一下经常会用到的操作。

筛选

按行操作

1、一般来讲,我们用的最多的就是filter(),无他,简单易懂,只需要在括号内加上我们的条件就行了,不过要注意用于筛选的条件一般都是要满足其格式的,建议在写之前先明确好要用到的东西,而不是一股脑地写逻辑。当然了,这里我也踩过一个小坑,就是filter()在运行时是不能识别NA的,在筛选时会自动去掉NA那一行,会因此忽略掉很多信息,所以我们一般先对数据集做NA判断,用is.na(),将NA值返回为1或者0,从而避免过滤了重要的信息。

2、而另一个用的比较多的就是slice()了,一般我们在筛选排名或者时间时用到,比如

lab_base <- lab_base %>%group_by(ID)%>% # 按照ID分组arrange(TIME)%>% # 按照TIME排序 slice(TIME,n=1)%>% # 选取时间最早的数据ungroup()%>%dplyr::select(ID,TIME,VALUE)

代码的意思是在每一组ID的分组内,先按照时间排序,再筛选时间最早的那个数据保留,这种用法相比平时用mid_time,可以节省很多算力空间,尤其是在涉及到数据量很大的rds文件时,大大提高我们的效率。

按列操作

而select()和mutate(),相信如果接触过一点R语言的都知道,我们经常会看到这两个语法,前者是把保存想要的列数据,后者则是对数据进行操作,添加或减少变量,有时也会用来添加中间变量来协助筛选,在结束时再去掉。值得注意的是,有很多包里都有select()的用法,我们一般默认的select()是dplyr里的,如果你不确定是否会调用到其他包的画,像上文用到的dplyr::select会直接调用我们想要的select。

节省算力小技巧

因子化

很多时候,我们存储的数据并不只是值,也有可能是文字,其中,有很多时候属于类别,比如男女,职业等,这个时候其实我们主要的需求是区分,而不是用这个值,自然也希望代码可以像我们一样,用起来简单。这个时候就可以对该列数据因子化,把他转换为分类变量,相当于把中文转换成了数字,这样会更好区分,所用到的内存也会更少。

按类别赋予值

与因子化的核心思想一样,都是通过节省代码判断中文的时间,只不过不同的是,我们可以新建一列,在筛选的同时先赋予一个等同于其类别的数字,方便在后面调用分类的时候用创建的新列,从而节省算力,比如:

lab_base $test_new <- 0
lab_base[grep("医生|科学家|植物学家",lab_base$NEW_JOB),]$test_new <- 1

这样,假如我们要筛选高科技人才时,就可以直接筛选test_new值为1的列。

函数

就像我们在其他语言中学过的类似一样,用function来执行很多需要重复的操作,可以节省算力,并大大提高我们的代码效率以及对代码的理解,但与其他语言不同的是,列表下函数的作用对象是会改变的,也就是说在写逻辑之前,不仅要想逻辑本身是否通顺,更要想清楚操作的对象是否适用于该方法,比如列表下的子列表,很多时候我们会将其转换为dataframe来操作,从而更好地处理数据,但在涉及到用function来操作列表里的内容是,用lapply来操作子列表,也会很方便,也能使其在操作完保持子列表的特性嵌套在列表中。

http://www.dtcms.com/wzjs/37652.html

相关文章:

  • 做盗版电影网站教程百度关键词搜索量排行
  • 网站建设课程设计的必要性网络营销介绍
  • 网站开发视频百度云百度产品
  • 自个做网站教程最近几天的重大新闻事件
  • 手表网站欧米茄价格腾讯控股第三季度营收1401亿
  • 北京商场skp班级优化大师官网登录
  • 制作商业网站网站创建公司
  • 可以做3d电影网站有哪些石家庄百度搜索优化
  • 专业做网站的人开封搜索引擎优化
  • 哈尔滨网站设计报价百度查询网
  • 维护网站需要多少钱武汉网站营销seo方案
  • 网站首页轮播图片素材国内免费发布产品的平台
  • 怎么样建设一个电影网站视频下载seo网络推广到底是做什么的
  • 手机门户WordPress主题windows11优化大师
  • 网站开发 与 网页设计的区别软文范例大全800字
  • 推广的网站有哪些全渠道营销
  • 上饶专业企业网站建设谷歌seo博客
  • 湖南网站建设公司谷歌搜索引擎为什么打不开
  • 建设银行嘉兴分行网站首页it培训学校哪家好
  • 西安哪里可以做公司网站免费网站在线客服软件
  • 建设公司网站费用怎么做账如何让自己的网站排名靠前
  • 免费制作自己的网站长产品品牌策划方案
  • 新的龙岗网站建设手机免费建网站
  • 做视频赚钱的网站有哪些百度账号登录不了
  • 政府网站建设赏析在线外链推广
  • 自己做壁纸的网站百度seo关键词排名价格
  • 做食品网站需要什么资质曼联vs曼联直播
  • 看男女做那个视频网站seo排名优化培训
  • 做网站那里做可靠深圳网络推广专员
  • 公交公司网站建设的意义南宁排名seo公司