当前位置: 首页 > news >正文

安装Hadoop并运行WordCount程序

一、安装 Java

Hadoop 依赖 Java,首先需要安装 Java 开发工具包(JDK)。以 Ubuntu 为例:

bash

sudo apt update
sudo apt install openjdk-8-jdk

安装后,设置环境变量:

bash

echo 'export JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64' >> ~/.bashrc
echo 'export PATH=$PATH:$JAVA_HOME/bin' >> ~/.bashrc
source ~/.bashrc

二、安装 Hadoop

  1. 下载 Hadoop

bash

wget https://downloads.apache.org/hadoop/common/hadoop-3.3.6/hadoop-3.3.6.tar.gz
tar -xzf hadoop-3.3.6.tar.gz
mv hadoop-3.3.6 /opt/hadoop

  1. 配置环境变量

bash

echo 'export HADOOP_HOME=/opt/hadoop' >> ~/.bashrc
echo 'export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin' >> ~/.bashrc
source ~/.bashrc

  1. 配置 Hadoop
    • core-site.xml

      xml

      <configuration><property><name>fs.defaultFS</name><value>hdfs://localhost:9000</value></property>
      </configuration>
      
    • hdfs-site.xml

      xml

      <configuration><property><name>dfs.replication</name><value>1</value></property><property><name>dfs.namenode.name.dir</name><value>file:/opt/hadoop/data/namenode</value></property><property><name>dfs.datanode.data.dir</name><value>file:/opt/hadoop/data/datanode</value></property>
      </configuration>
      

三、启动 Hadoop

  1. 格式化 NameNode

bash

hdfs namenode -format

  1. 启动 HDFS 和 YARN

bash

start-dfs.sh
start-yarn.sh

  1. 验证服务
    访问 http://localhost:9870 查看 HDFS 界面,http://localhost:8088 查看 YARN 界面。

四、运行 WordCount 程序

  1. 准备输入数据

bash

echo "Hello Hadoop World" > input.txt
hdfs dfs -mkdir -p /user/input
hdfs dfs -put input.txt /user/input

  1. 执行 WordCount

bash

hadoop jar $HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.6.jar wordcount /user/input /user/output

  1. 查看结果

bash

hdfs dfs -cat /user/output/part-r-00000

相关文章:

  • ACL访问控制列表:access-list 10 permit 192.168.10.1
  • MySQL-逻辑架构
  • (五)毛子整洁架构(分布式日志/Redis缓存/OutBox Pattern)
  • 不定长滑动窗口---初阶篇
  • 科技快讯 | 字节跳动开源一款Deep Research项目;全球首个氮化镓量子光源芯片发布
  • 图论拓扑排序
  • Spring Boot动态配置修改全攻略
  • 神经符号推理系统:研究进展与应用前景
  • MCP 入门实战:用 C# 开启 AI 新篇章
  • 文本数据可视化
  • 【软件工程】软件缺陷 基于组合的优化方法
  • Python爬虫实战:研究ajax异步渲染加密
  • keil 解决 Error: CreateProcess failed, Command: ‘XXX\ARM\ARMCC\bin\fromelf.exe
  • 自动驾驶技术栈——DoIP通信协议
  • 如何让rabbitmq保存服务断开重连?保证高可用?
  • tryhackme——Lateral Movement and Pivoting
  • 学习threejs,使用Physijs物理引擎,加载各种几何体网格对象
  • 【Web前端开发】CSS基础
  • vue2关闭eslint
  • 通义千问席卷日本!开源界“卷王”阿里通义千问成为日本AI发展新基石
  • 福州千余公共道路泊车位装“智能地锁”续:运营公司被责令改正并罚款
  • 书法需从字外看,书法家、学者吴本清辞世
  • 法治日报:炮制师生日常剧本,校园怎么成了短视频流量秀场?
  • 伊美第四轮核问题谈判开始
  • 云南省安委会办公室:大理州安全生产形势比较严峻,事故总量一直居高不下
  • 七方面118项任务,2025年知识产权强国建设推进计划印发