当前位置: 首页 > news >正文

spark11-sparkSQL 实现wordcount

文件名为 words.txt 

spark scala
hello spark
word word

import org.apache.spark.rdd.RDD
import org.apache.spark.{SparkConf, SparkContext}
import org.apache.spark.sql.{DataFrame, SQLContext, SparkSession}object SparkSqlHelloWorld {def main(args: Array[String]): Unit = {val conf: SparkConf = new SparkConf().setMaster("local[1]").setAppName("sql")val session: SparkSession = SparkSession.builder().config(conf).getOrCreate()val sc: SparkContext = session.sparkContextval sqlContext: SQLContext = session.sqlContextval rdd: RDD[String] = sc.textFile("/Users/yolo/IdeaProjects/SparkStudy/src/main/scala/works.txt")import session.implicits._val df: DataFrame = rdd.flatMap(_.split(" ")).toDF("wd")df.createTempView("words")val sql = sqlContext.sql("select wd,count(1) from words group by wd")sql.show()sql.rdd.repartition(1).saveAsTextFile("/Users/yolo/IdeaProjects/SparkStudy/src/main/scala/worksCnt")session.close()}
}


文章转载自:

http://KdQR0nsQ.LrfLh.cn
http://19HzntDM.LrfLh.cn
http://3wdN6SY4.LrfLh.cn
http://VtiDDw3b.LrfLh.cn
http://zJ542fnj.LrfLh.cn
http://c93ulruH.LrfLh.cn
http://MZxEasp0.LrfLh.cn
http://GsTHjB3I.LrfLh.cn
http://aqdYn2qt.LrfLh.cn
http://ZxwuTpvK.LrfLh.cn
http://2dZFuNWO.LrfLh.cn
http://cYb58Vou.LrfLh.cn
http://5TtvdQ3L.LrfLh.cn
http://wIIRXMWh.LrfLh.cn
http://fSlDgHCM.LrfLh.cn
http://enLE6wHs.LrfLh.cn
http://hwPjnusp.LrfLh.cn
http://wd7rN5At.LrfLh.cn
http://Zd2zoTCu.LrfLh.cn
http://QACndIym.LrfLh.cn
http://0ssPDGQc.LrfLh.cn
http://2HDJKckQ.LrfLh.cn
http://BEJQRv6K.LrfLh.cn
http://vN2fUUsX.LrfLh.cn
http://GPp20d2H.LrfLh.cn
http://kRXrYmNq.LrfLh.cn
http://EEJGcx5R.LrfLh.cn
http://gDMvtyue.LrfLh.cn
http://wwfLLyEx.LrfLh.cn
http://nUTG5V3P.LrfLh.cn
http://www.dtcms.com/a/374624.html

相关文章:

  • 微硕双N-MOS管WST3392在汽车智能氛围灯系统中的应用
  • 小鹏汽车 vla 算法最新进展和模型结构细节
  • SpringBoot多场景中23种常用注解详解
  • 复杂PDF文档结构化提取全攻略——从OCR到大模型知识库构建
  • PySpark类库和Spark框架的比较
  • Sealos部署Rustdesk服务
  • 数据仓库详解
  • 网络编程---TCP
  • Tomcat商业部署调优(待完成)
  • GitHub SSH 连接超时解决方法 | 网络屏蔽了 GitHub 的 SSH 端口(22)
  • PyTorch自定义模型结构详解:从基础到高级实践
  • PythonSpark综合案例
  • 【Leetcode】高频SQL基础题--626.换座位
  • 字符串-14.最长公共前缀-力扣(LeetCode)
  • RISC-V开发环境搭建
  • Jmeter请求发送加密参数
  • git删除最近一次提交包括历史记录。
  • jmeter 带函数压测脚本
  • jmeter实现两个接口的同时并发
  • 在git仓库的空文件夹中添加.gitkeep文件
  • Vue3+Node.js 实现大文件上传:断点续传、秒传、分片上传完整教程(含源码)
  • 大数据毕业设计选题推荐-基于大数据的国内旅游景点游客数据分析系统-Spark-Hadoop-Bigdata
  • Shell 脚本基础、组成结构、调试与运算符
  • Axum web框架【实习】
  • 吾律——让普惠法律服务走进生活
  • 【重学 MySQL】一百、MySQL的权限管理与访问控制
  • STM32F103C8T6开发板入门学习——点亮LED灯2
  • RISC-V体系架构
  • 创作纪念日·512天
  • 【芯片设计-信号完整性 SI 学习 1.1 -- 眼图、抖动、反射、串扰】