当前位置: 首页 > wzjs >正文

南京网站官网建设湖南企业seo优化首选

南京网站官网建设,湖南企业seo优化首选,成都专业网站建设厂,外贸推广公司排名一、RDD 转换算子分类:根据数据处理方式,RDD 算子分为 Value 类型、双 Value 类型和 Key - Value 类型。 1.Value 类型算子 map:逐条映射转换数据,可改变数据类型或值 mapPartitions:以分区为单位处理数据&#xff0…

一、RDD 转换算子分类:根据数据处理方式,RDD 算子分为 Value 类型、双 Value 类型和 Key - Value 类型。

1.Value 类型算子

map:逐条映射转换数据,可改变数据类型或值

mapPartitions:以分区为单位处理数据,可进行任意操作,能增删数据,但可能占用大量内存,内存有限时不推荐使用。与 map 相比,map 是分区内串行处理数据,mapPartitions 是分区批处理。

mapPartitionsWithIndex:类似 mapPartitions,处理数据时可获取当前分区索引。

flatMap:先扁平化数据再映射处理,区别于 map 将每条输入数据映射为一个新对象,flatMap 会将输入对象映射为新集合并连接成大集合。

glom:把同一分区数据转换为内存数组,分区不变。

groupBy:按指定规则分组数据,会打乱重组数据(shuffle),可能导致数据倾斜。

filter:筛选过滤数据,保留符合规则的,丢弃不符合的,可能造成分区内数据不均衡。

sample:按规则抽取数据,分不放回(伯努利算法)和放回(泊松算法)两种方式。

distinct:去除数据集中重复数据,可指定分区数。

coalesce:根据数据量缩减分区,提升小数据集执行效率,减少任务调度成本。

repartition:内部执行 coalesce 操作,默认 shuffle 为 true,可实现分区数增减。

sortBy:排序数据,可先处理数据再按处理结果排序,默认升序,会发生 shuffle,新 RDD 分区数与原 RDD 一致。

2.双 Value 类型算子

intersection:求两个 RDD 的交集。

union:求两个 RDD 的并集,重复数据不会去重。

subtract:以源 RDD 元素为主,去除重复元素,保留源 RDD 其他元素(求差集)。

zip:将两个 RDD 元素以键值对形式合并,Key 为第一个 RDD 元素,Value 为第二个 RDD 相同位置元素。

3.Key - Value 类型算子

partitionBy:按指定 Partitioner 重新分区,Spark 默认分区器是 HashPartitioner。

groupByKey:根据 key 对 value 进行分组,存在 shuffle 操作,但无预聚合功能。

reduceByKey:按相同 Key 聚合 Value,可在 shuffle 前预聚合,减少落盘数据量,性能优于 groupByKey ,兼具分组和聚合功能。

aggregateByKey:按不同规则进行分区内和分区间计算。

foldByKey:当分区内和分区间计算规则相同时,是 aggregateByKey 的简化版。

combineByKey:通用的对 key - value 型 rdd 进行聚集操作的函数,可让第一个数据转换结构,分区内和分区间计算规则不同。

sortByKey:对 (K, V) 的 RDD 按 key 排序,K 需实现 Ordered 接口。

join:连接两个 (K, V) 和 (K, W) 类型的 RDD,返回相同 key 对应的元素连接在一起的 (K, (V, W)) 的 RDD

leftOuterJoin:类似 SQL 左外连接。

cogroup:在 (K, V) 和 (K, W) 类型的 RDD 上调用,返回 (K, (Iterable<V>, Iterable<W>)) 类型的 RDD

http://www.dtcms.com/wzjs/360533.html

相关文章:

  • 安徽建设工程信息网官方网站百度怎么搜索图片
  • 做淘客网站怎么样网络广告网站
  • 家居企业网站建设新闻做百度推广员赚钱吗
  • 网站建设需要具备的能力经典软文案例和扶贫农产品软文
  • 做当地门户网站多少钱上海网站快速优化排名
  • 余姚做百度网站台州seo快速排名
  • 佛山做网站制作淘宝搜索关键词技巧
  • 有哪些网站可以免费做外销网络营销软件商城
  • 行业类网站应如何建设链接怎么做
  • 公司做网站哪个好百度快照推广是什么意思
  • 金融做网站网络营销公司怎么注册
  • 网站建设制作设计seo优化山东长沙网址seo
  • 合肥市建设局网站最近七天的新闻大事
  • 成都微信网站开发媒体公关是做什么的
  • 基于asp的网站设计与实现企业线上培训平台
  • 梅林 做服务器 网站找关键词
  • 网站建设联系上海优化外包
  • 在美国做垂直网站百度收录查询工具官网
  • 免费动态网站成品作业seo搜索引擎优化岗位要求
  • 曰本做爰网站免费广告推广软件
  • 网站滚动式标题如何做网站seo运营
  • 遵义在百度做个网站多少钱seo管理工具
  • 衡水网站制作报价优化大师的作用
  • 网站 建设 原则优就业seo怎么样
  • wordpress 结合qq百度搜索关键词优化方法
  • 打字网站怎么做安徽网站关键字优化
  • 八方资源网做网站优化怎么样包头seo
  • 张家港网站建设优化营销策略ppt模板
  • 深圳建立网站营销百度关键词排名点
  • 手机好看的网站免费的推文制作网站