当前位置: 首页 > news >正文

使用idea开发spark程序

新建scala 项目

创建lib目录

将spark  jars/   路径下所有jar 复制到  lib目录

 添加依赖

创建scala 程序

 

 

package spark

import org.apache.spark.{SparkConf, SparkContext}

object WordCount {
  def main(args: Array[String]): Unit = {
    
    val conf = new SparkConf().setAppName("WordCount").setMaster("local") //本地模式
    //    val conf = new SparkConf().setAppName("WordCount") //集群模式s
    val sc = new SparkContext(conf)

    val result = sc.textFile("hdfs://bigdata112:9000/user/test001.txt")
      .flatMap(_.split(" ")).map((_,1)).reduceByKey(_+_)
      .collect
    result.foreach(println)

    println("Hello, World!")
  }
  
}

准备测试数据

上传hdfs

hdfs dfs -put test001.txt /user/

 运行程序

http://www.dtcms.com/a/95892.html

相关文章:

  • 2025年数智化电商产业带发展研究报告260+份汇总解读|附PDF下载
  • uWebSockets开发入门
  • ai-api-union项目,适配各AI厂商api
  • win32汇编环境,网络编程入门之十四
  • 不落因果与不昧因果
  • nginx refer与origin的异常数据拦截
  • Ollama - 官方文档翻译
  • Redis的List类型
  • 自动化发布工具CI/CD实践Jenkins各配置功能介绍和管理!
  • 3.28 代码随想录第二十九天打卡
  • uvm phase
  • 海康威视摄像头混合目标检测事件数据说明文档
  • 3.1.3 MYSQL连接池
  • 第十一章:Python PIL库-图像处理
  • 智能仪表板DevExpress Dashboard v24.2新版亮点:支持.NET 9
  • 【Java】Springboot整合redis
  • 【go微服务】如何快速掌握grpc开发
  • 王者荣耀服务器突然崩了
  • 基于类型属性的重载
  • 标准库中有uint32_t类型吗?
  • 深入剖析Redis分布式锁:Redlock算法源码解读与实战
  • C++修炼:string类的使用
  • 前端Vue
  • 【HCIA-网工探长】12:生成树笔记
  • Python使用ccplot绘制CALIPSO L1B后向散射
  • C# 异步方法设计指南:何时使用 await 还是直接返回 Task?
  • C++ 字符处理、编码格式
  • 20250328易灵思FPGA的烧录器FT4232_DL的驱动安装
  • postgresql+patroni+etcd高可用安装
  • unity 截图并且展现在UI中