当前位置: 首页 > news >正文

运行Spark程序-在shell中运行 --SparkConf 和 SparkContext

SparkConf 类用于配置 Spark 应用程序的各种参数。通过 SparkConf 类,你可以设置应用程序的名称、运行模式(如本地模式、集群模式)、资源分配(如内存、CPU 核心数)等。主要作用配置应用程序参数:可以设置 Spark 应用程序的各种属性,如应用程序名称、主节点地址等。

SparkContext 是 Spark 应用程序的入口点,它代表了与 Spark 集群的连接。通过 SparkContext,你可以创建 RDD(弹性分布式数据集)、累加器、广播变量等,还可以与外部数据源进行交互。

准备工作:启动hdfs集群,打开hadoop100:9870,在wcinput目录下上传一个包含很多个单词的文本文件。

写交互式代码:启动之后在spark-shell中写代码。

 进入环境:spark-shell --master yarn

逐句写代码:

// 读取文件,得到RDDval rdd1 = sc.textFile("hdfs://hadoop100:8020/wcinput/words.txt")// 将单词进行切割,得到一个存储全部单词的RDDval rdd2= fileRDD.flatMap(line => line.split(" "))// 将单词转换为元组对象,key是单词,value是数字1val rdd3= wordsRDD.map(word => (word, 1))// 将元组的value按照key来分组,对所有的value执行聚合操作(相加)val rdd4= wordsWithOneRDD.reduceByKey((a, b) => a + b)// 收集RDD的数据并打印输出结果rdd4.collect().foreach(println)


文章转载自:

http://kVHB3LoR.crsqs.cn
http://ad5nDP7L.crsqs.cn
http://LPWDiWlq.crsqs.cn
http://gGkwTVUV.crsqs.cn
http://NdxJxTxE.crsqs.cn
http://vJJMI5Rz.crsqs.cn
http://XJC4RGCN.crsqs.cn
http://HJGCyu1S.crsqs.cn
http://uvV6n4Go.crsqs.cn
http://v7eoobnm.crsqs.cn
http://QwTXPSDM.crsqs.cn
http://Q4BqqkdS.crsqs.cn
http://WuVO3TEc.crsqs.cn
http://dtD8O2bp.crsqs.cn
http://pDfH4CF6.crsqs.cn
http://8mZcrxne.crsqs.cn
http://QThdPnHa.crsqs.cn
http://P4iBuik1.crsqs.cn
http://tDIptSFU.crsqs.cn
http://81mH9x8s.crsqs.cn
http://N05C4AT7.crsqs.cn
http://miQQlwS6.crsqs.cn
http://qXXyCVV8.crsqs.cn
http://dnmQmBza.crsqs.cn
http://r3EXlYYQ.crsqs.cn
http://cMkkOO9o.crsqs.cn
http://5UEXIjIE.crsqs.cn
http://UHB1oItc.crsqs.cn
http://WYAJcQs3.crsqs.cn
http://9NsQzDox.crsqs.cn
http://www.dtcms.com/a/188977.html

相关文章:

  • 基于FPGA的视频接口之千兆网口(六GigE纯逻辑)
  • 深入理解BLP安全模型:信息安全中的“守密者”
  • 【力扣】K个一组翻转链表
  • 使用 百度云大模型平台 做 【提示词优化】
  • OpenMCU(七):STM32F103开发环境搭建
  • 如何选择与构建高效的网络流量分析平台
  • 【设备管理—磁盘调度算法】
  • 17.责任链模式:思考与解读
  • .Net HttpClient 处理错误与异常
  • Vue3+uniapp 封装axios
  • 计网实验笔记(一)CS144 Lab
  • 《猜拳游戏》
  • solidwors插件 开发————仙盟创梦IDE
  • uniapp开发4--实现耗时操作的加载动画效果
  • 按键精灵ios脚本新增元素功能助力辅助工具开发(三)
  • 应用探析|千眼狼PIV测量系统在职业病防治中的应用
  • 小天互连即时通讯:制造行业沟通协作的高效纽带
  • JavaScript 接收并解析后端发送的 JSON 数据,同时将数据以美观的方式展示在页面上
  • Kotlin-类和对象
  • TCP首部格式及三次握手四次挥手
  • 【学习笔记】Shell编程---流程控制语句
  • 【用「概率思维」重新理解生活】
  • 深入探讨 Java 性能术语与优化实践
  • 12.1寸工业液晶屏M121XGV20-N10显示单元技术档案
  • ubuntu22.04编译PX4无人机仿真实践
  • Git命令起别名
  • Cursor开发酒店管理系统
  • 【AI论文】健康的大型语言模型(LLMs)?——评估大型语言模型对英国政府公共健康信息的掌握程度
  • 什么是序列化与反序列化
  • Kubernetes 标签和注解