当前位置: 首页 > news >正文

在IDEA中编写Spark程序并运行

Spark是基于scala的,当然它也可以支持java和scala还有python语言,我们这里会使用scala。

1.在Idea中安装插件,使得Idea中可以编写scala代码。

2.使用Maven创建项目,并在pom.xml文件中配置相关的依赖。

3.设置maven依赖项。修改pom.xml文件,添加如下

4.下载依赖。添加完成之后,刷新Maven,它会帮助我们去下载依赖。

6.新建Scala类。如果这里没有看到Scala类的选项,就去检查第2步。

编写代码如下:

8.准备待统计的词频文件。在项目根目录下建立文件夹input,并穿件两个文本文件:word1.txt, word2.txt

9.运行代码。点击运行代码,生成代码如下

相关文章:

  • 2025.05.07-华为机考第三题300分
  • C++初阶-string类4
  • DeepSeek智能时空数据分析(九):NL2SQL绘制河流名字-如何给轨迹添加说明文字
  • Qt 中基于 spdlog 的高效日志管理方案
  • 服务器上机用到的设备
  • 【spring】Spring、Spring MVC、Spring Boot、Spring Cloud?
  • 结构可视化:利用数据编辑器剖析数据内在架构​
  • 线程池技术
  • ​​大疆无人机SDR 链路​​
  • AGV智能搬运机器人:富唯智能引领工业物流高效变革
  • 如何判断自己是否适合做项目管理?
  • 成都养老机器人“上岗”,机器人养老未来已至还是前路漫漫?
  • 拒绝服务攻击(DoS/DDoS/DRDoS)详解:洪水猛兽的防御之道
  • 低成本监控IPC模组概述
  • 堆排序(算法题)
  • 快速上手知识图谱开源库pykeen教程指南(一)
  • 【RabbitMQ可靠性原理】
  • JMeter快速指南:命令行生成HTML测试报告(附样例命令解析)
  • 传输层协议 1.TCP 2.UDP
  • D盘出现不知名文件
  • 巴基斯坦称未违反停火协议
  • 巴基斯坦称对印精准打击造成设施损坏和人员伤亡
  • 罕见沙尘再度入川,官方:沙尘传输高度达到平流层,远超以往
  • 新疆维吾尔自治区乌鲁木齐市米东区政协原副主席朱文智被查
  • 本科生已发14篇SCI论文被指由其教授父亲挂名,重庆大学成立工作组核实
  • 2024年上市公司合计实现营业收入71.98万亿元