当前位置: 首页 > news >正文

使用idea开发spark程序

新建scala 项目

创建lib目录

将spark  jars/   路径下所有jar 复制到  lib目录

 添加依赖

创建scala 程序

 

 

package spark

import org.apache.spark.{SparkConf, SparkContext}

object WordCount {
  def main(args: Array[String]): Unit = {
    
    val conf = new SparkConf().setAppName("WordCount").setMaster("local") //本地模式
    //    val conf = new SparkConf().setAppName("WordCount") //集群模式s
    val sc = new SparkContext(conf)

    val result = sc.textFile("hdfs://bigdata112:9000/user/test001.txt")
      .flatMap(_.split(" ")).map((_,1)).reduceByKey(_+_)
      .collect
    result.foreach(println)

    println("Hello, World!")
  }
  
}

准备测试数据

上传hdfs

hdfs dfs -put test001.txt /user/

 运行程序

相关文章:

  • 2025年数智化电商产业带发展研究报告260+份汇总解读|附PDF下载
  • uWebSockets开发入门
  • ai-api-union项目,适配各AI厂商api
  • win32汇编环境,网络编程入门之十四
  • 不落因果与不昧因果
  • nginx refer与origin的异常数据拦截
  • Ollama - 官方文档翻译
  • Redis的List类型
  • 自动化发布工具CI/CD实践Jenkins各配置功能介绍和管理!
  • 3.28 代码随想录第二十九天打卡
  • uvm phase
  • 海康威视摄像头混合目标检测事件数据说明文档
  • 3.1.3 MYSQL连接池
  • 第十一章:Python PIL库-图像处理
  • 智能仪表板DevExpress Dashboard v24.2新版亮点:支持.NET 9
  • 【Java】Springboot整合redis
  • 【go微服务】如何快速掌握grpc开发
  • 王者荣耀服务器突然崩了
  • 基于类型属性的重载
  • 标准库中有uint32_t类型吗?
  • 在线制作公司网站/网络推广需要什么
  • 黑龙江进入疫情紧急状态/快速排名优化公司
  • 怎么做网站自动采集数据库/百度一下百度一下你就知道
  • 交友网站html5模板/友情链接购买平台
  • 贵州省建设厅网站多少/互联网广告代理
  • 网站建设咨询有客价优网站建/北京搜索引擎优化