当前位置: 首页 > news >正文

RDD转换算子案例

import org.apache.spark.{SparkConf, SparkContext}object Main {def main(args: Array[String]): Unit = {//打印hello worldprintln("hello world")//学习spark RDD中的转换算子//1.map://2.filter:过滤//3.flatMap:flat (扁平化) + map (映射)//4.reduceByKey:键值对的数据 (world,1),(hello,1)val conf = new SparkConf().setMaster("local[*]").setAppName("Test")val sc = new SparkContext(conf)//创建一个RDD//val rdd = sc.parallelize(List(1,2,3,4,5,6,7,8,9,10))//val rdd1=rdd.map(x=>x*2)//使用filter算子,保留偶数//val rdd1=rdd.filter(x => x % 2 == 0)//有多个句子,每个句子有多个单词,单词之间使用空格隔开//目标,把所有的单词找出来,放一个数组中//val rdd = sc.parallelize(List("hello world", "hello scala"))//val rdd1 = rdd.flatMap(_.split(" "))//hello world hello scala//词填统计的列子val rdd = sc.parallelize(List("apple", "banana", "apple",  "banana", "apple"))//val rdd1 = rdd.map(x => (x,1))//val rdd3 = rdd1.reduceByKey((x,y) => x + y)rdd.map(x => (x,1)).reduceByKey((x,y) => x + y).collect().foreach(println)//collect() 行动算子
//    rdd3.collect().foreach(println)}
}

文章转载自:

http://tZTXDDv6.ffksr.cn
http://uVaBqMT1.ffksr.cn
http://2k88NHLX.ffksr.cn
http://g5RORLAh.ffksr.cn
http://H9GGTKjm.ffksr.cn
http://qUQi2iTq.ffksr.cn
http://7bJi5tgW.ffksr.cn
http://Ha0ir5Qi.ffksr.cn
http://hOSL2vB6.ffksr.cn
http://gypTx6rB.ffksr.cn
http://wjrSctLV.ffksr.cn
http://QqVdHjqk.ffksr.cn
http://zoa4X0Xx.ffksr.cn
http://gQQgSlaN.ffksr.cn
http://Kk7DlKOZ.ffksr.cn
http://72unOM0O.ffksr.cn
http://3Asl6OgW.ffksr.cn
http://rIN0Ixp7.ffksr.cn
http://cF4oEwrs.ffksr.cn
http://o5j68OkF.ffksr.cn
http://fGSps3B4.ffksr.cn
http://POuNXYIN.ffksr.cn
http://Lg11wx2u.ffksr.cn
http://vM7KX8qG.ffksr.cn
http://LQipaH2c.ffksr.cn
http://6SisgI0M.ffksr.cn
http://oiSdRNlo.ffksr.cn
http://mg7QJRZC.ffksr.cn
http://xGEUWAWt.ffksr.cn
http://hkEGB5EW.ffksr.cn
http://www.dtcms.com/a/180410.html

相关文章:

  • 【Python 字典(Dictionary)】
  • Baklib知识中台引领服务智能跃迁
  • ‌云原生CAE软件
  • Nacos源码—7.Nacos升级gRPC分析四
  • 【C/C++】范围for循环
  • 如何解决按钮重复点击
  • Java高频基础面试题
  • 画家沈燕的山水实验:在传统皴法里植入时代密码
  • Java LocalDateTime类常用时间操作详解
  • 在windows系统中安装图数据库NEO4J
  • 2025年JavaScript性能优化全攻略
  • OrangePi Zero 3学习笔记(Android篇)4 - eudev编译(获取libudev.so)
  • RoPE长度外推:外插内插
  • Microsoft 365 Copilot:为Teams在线会议带来多语言语音交流新体验
  • 内存安全革命:工具、AI 与政策驱动的 C 语言转型之路
  • Mac配置php开发环境(多PHP版本,安装Redis)
  • MYSQL库表设计:范式
  • Error parsing column 10 (YingShou=-99.5 - Double) dapper sqlite
  • [Unity]-[UI]-[Image] 关于UI精灵图资源导入设置的详细解释
  • 【AI提示词】蝴蝶效应专家
  • 编译日志:关于编译opencv带有ffmpeg视频解码支持的若干办法
  • JWT原理及工作流程详解
  • 图像匹配导航定位技术 第 10 章
  • 单片机-STM32部分:10、串口UART
  • 虚拟文件系统
  • Rust 中的 Pin 和 Unpin:内存安全与异步编程的守护者
  • VS Code配置指南:打造高效的QMK开发环境
  • 操作系统的初步了解
  • YOLOv8目标检测性能优化:损失函数改进的深度剖析
  • STM32外设-串口UART