当前位置: 首页 > news >正文

将 MapReduce 程序打成 JAR 包并在 Linux 虚拟机的 Hadoop 集群上运行

将 JAR 包上传到 Linux 虚拟机

①确保pom.xml中添加了 Maven 打包插件,用于将项目打包成可执行 JAR

    <build><plugins><plugin><groupId>org.apache.maven.plugins</groupId><artifactId>maven-compiler-plugin</artifactId><version>3.1</version>  <configuration><source>8</source><target>8</target><encoding>UTF-8</encoding><!--      <verbal>true</verbal>  --></configuration></plugin><plugin><groupId>org.apache.maven.plugins</groupId><artifactId>maven-shade-plugin</artifactId><version>3.6.0</version><executions><execution><phase>package</phase><goals><goal>shade</goal></goals><configuration><minimizeJar>true</minimizeJar></configuration></execution></executions></plugin></plugins></build>

maven-compiler-plugin的3.1版本支持JDK1.8

<source>/<target>级别写8或1.8均可,都代表同一个Java工具包

maven-shade-plugin的3.6版本支持JDK1.8

②打开 IDEA 的 Maven 面板(右侧边栏)

③展开生存期(Lifecycle),双击package,Maven 会自动编译并打包项目

④打包完成后,JAR 包会生成在项目的target目录下,如果忘记了项目目录,光标移动到项目名上会出现

⑤选择jar包复制,到Linux系统中粘贴:

第一个jar包:

如果运行环境没有提供项目所需的依赖(比如在一个没有预装 Hadoop 相关类库的环境中运行 MapReduce 程序),就需要使用这种包含了所有依赖的胖 JAR,这样程序才能在缺少外部依赖的环境中独立运行。

original 开头的jar包:

不会包含项目所依赖的第三方库,当Linux 上的 Hadoop 集群已经提供了项目所需的所有依赖,那么只需要上传项目自身的代码 JAR 就能运行

在 Linux 虚拟机中运行 JAR 包

①启动Hadoop 集群,通过jps命令验证,NameNode、DataNode、ResourceManager、NodeManager均正常启动:

start-all.sh
jps

#如果是特定任务需要完成前置步骤,比如单词统计需要创建input文件并上传到hdfs上,这里是通用的关键步骤

② 运行 MapReduce JAR 包

使用 hadoop jar 命令提交作业,格式为:

hadoop jar 你的JAR包路径 主类全限定名 HDFS输入路径 HDFS输出路径

示例(假设 JAR 包为 wordcount.jar,输入路径为 /input,输出路径为 /output):

hadoop jar /home/hadoop/wordcount.jar mapreduce.WordCountDriver /input /output

http://www.dtcms.com/a/477656.html

相关文章:

  • 06_Miniconda零基础安装配置指南:打造高效的Python开发环境
  • 量子计算与AI融合:材料科学新突破!!
  • 徐州网站建设方案咨询外贸牛
  • 顶级 AI 模型横评:智能、性能与价格等方面全面对比
  • Vuex 详细用法(Vue2 和 Vue3)
  • 注册公司网站如何注册黑龙江公共资源交易网官网
  • 如何将iPhone上的HEIF图像下载到电脑
  • 欧洲宇航局使用Varjo XR头戴设备为宇航员提供虚拟现实空间站任务训练
  • iphone IOS3~IOS9游戏 旧iphone 单机游戏合集分享
  • 昂瑞微冲刺科创板:硬科技与资本市场的双向奔赴
  • 从入门到精通【Redis】Redis 典型应⽤ --- 缓存 (cache)
  • 【深入理解计算机网络10】UDP协议详解
  • 宁波网站建设模板制作什么叫优化
  • 自动裁剪图(电商使用)
  • 大模型应用开发
  • 第15题 三数之和
  • 【1015】计算并联电阻的阻值
  • 红黑树实现与原理剖析(上篇):核心规则与插入平衡逻辑
  • 【AES加密专题】8.实战-测试加密网站和代码
  • 收费的电影网站怎么做可以打开任何网站的软件
  • 设计广告网站wordpress怎么换空间
  • React 18并发模式解析:Fiber架构与性能优化技巧
  • 火山引擎多媒体实验室画质理解大模型Q-Insight入选NeurIPS 2025 Spotlight
  • 【StarRocks】-- DATETIME 与 TIMESTAMP 区别详解
  • k8s nginx ingress介绍
  • 深入starrocks-怎样实现多列联合统计信息
  • 无锡百度网站推广廊坊seo优化排名
  • 小程序如何接入火山引擎埋点数据
  • 汝阳网站建设哪家好旅游社网站建设规划书
  • Qt MSVC_64bit在Release模式下调试与WinDbg调试exe