当前位置: 首页 > news >正文

Hadoop 2.7.7 单机伪分布式安装与配置教程(JDK 8)

1. 前提准备

  • 操作系统:CentOS 7/Ubuntu等Linux
  • JDK 1.8 已安装并配置好(java -version能正常输出)
  • 普通用户或root均可(建议用普通用户,root也没问题)

2. 下载与解压

  1. 官方下载Hadoop 2.7.72

https://archive.apache.org/dist/hadoop/common/hadoop-2.7.7/hadoop-2.7.7.tar.gz

  1. 上传到虚拟机(如/home/wang/soft
  2. 解压:

       tar -zxvf hadoop-2.7.7.tar.gz

3. 配置环境变量

编辑  /etc/profile,追加如下内容(不要覆盖原有PATH):

export JAVA_HOME=/home/wang/soft/jdk
export HADOOP_HOME=/home/wang/soft/hdfs/hadoop-2.7.7
export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

保存后执行:

source /etc/profile 

4. 修改Hadoop配置文件

4.1 配置 JAVA_HOME

编辑:

vi $HADOOP_HOME/etc/hadoop/hadoop-env.sh

找到export JAVA_HOME=${JAVA_HOME}

改为

export JAVA_HOME=/home/wang/soft/jdk 

(路径按实际你的JDK路径填写)

4.2 配置 core-site.xml

编辑:

vi $HADOOP_HOME/etc/hadoop/core-site.xml

在 <configuration> 标签内添加:

<property>
  <name>fs.defaultFS</name>
  <value>hdfs://localhost:9000</value>
</property> 

4.3 配置 hdfs-site.xml

编辑:

vi $HADOOP_HOME/etc/hadoop/hdfs-site.xml

在 <configuration> 标签内添加: 

<property>
  <name>dfs.replication</name>
  <value>1</value>
</property>
<property>
  <name>dfs.namenode.name.dir</name>
  <value>file:/home/wang/soft/hdfs/hadoop-2.7.7/data/nameNode</value>
</property>
<property>
  <name>dfs.datanode.data.dir</name>
  <value>file:/home/wang/soft/hdfs/hadoop-2.7.7/data/dataNode</value>
</property>

 5. 格式化HDFS(只需第一次)

hdfs namenode -format

看到successfully formatted即成功。

6. 启动Hadoop

start-dfs.sh 

如提示找不到命令,先执行source ~/.bashrc

 7. 检查进程

jps

应看到 NameNode、DataNode、SecondaryNameNode 等进程。

如果没有完全显示的话就要手动开启一下

hadoop-daemon.sh start namenode
hadoop-daemon.sh start datanode

8. Web界面访问

  • NameNode管理页面:http://你的虚拟机IP:50070
  • SecondaryNameNode:http://你的虚拟机IP:50090

9. 常用命令

  • 查看HDFS根目录:

  hdfs dfs -ls /

 上传文件到HDFS:

  hdfs dfs -put 本地文件 /目标目录

下载文件到本地:

  hdfs dfs -get /hdfs文件 本地目录 

10. 常见问题与解决

  • hadoop version 报错找不到bash

→ 修复PATH,确保/bin在PATH里,或用ln -s /bin/bash /usr/bin/bash

  • JAVA_HOME未配置或配置错

→ 检查hadoop-env.sh和环境变量,必须用绝对路径

  • 端口被占用

→ 改配置文件中的端口,或释放端口

  • 权限问题

→ 确保所有Hadoop相关目录有当前用户写权限

11. 关闭Hadoop

stop-dfs.sh

 12. 彻底卸载(如需重来)

rm -rf /home/wang/soft/hdfs/hadoop-2.7.7

相关文章:

  • LSTM-XGBoost回归预测,多输入单输出(Matlab完整源码和数据)
  • 洛谷B3612 【深进1.例1】求区间和
  • matlab脉冲信号并绘制波形2025.6.11
  • java每日精进 6.11【消息队列】
  • Python训练营打卡 Day51
  • Weblogic 弱口令-任意文件读取
  • 零基础设计模式——行为型模式 - 中介者模式
  • IDEA 连接 Docker 一键打镜像
  • k8s 部署服务常见错误原因
  • 【基于阿里云上Ubantu(x86-64)系统部署配置K8s】
  • Springboot+idea热更新
  • 句法分析 自然语言处理
  • springboot + nacos + k8s 优雅停机
  • redisson锁的可重入、可重试、超时续约原理详解
  • 第七章——8天Python从入门到精通【itheima】-81~82(函数的多返回值+函数多种传参方式)
  • 深入解析MySQL Join算法原理与性能优化实战指南
  • 附加模块--Qt SQL模块功能及架构解析
  • 在GIS 工作流中实现数据处理(2)
  • 小米15系列摄影进阶:100+专业级相机预设包实测与调参指南
  • Cockpit:一个开源的 Linux 系统管理工具
  • 苹果正秘密开发搜索引擎/福州短视频seo获客
  • 网站加入我们页面/小程序开发公司排行榜
  • 做网站必须需要服务器嘛/百度推广平台收费标准
  • 挂机宝做网站可以吗/社群营销方案
  • 自己做的网站涉黄/外贸网络推广营销
  • 淘宝客网站可以做分销吗/网络推广外包想手机蛙软件