当前位置: 首页 > news >正文

Hadoop 2.7.7 单机伪分布式安装与配置教程(JDK 8)

1. 前提准备

  • 操作系统:CentOS 7/Ubuntu等Linux
  • JDK 1.8 已安装并配置好(java -version能正常输出)
  • 普通用户或root均可(建议用普通用户,root也没问题)

2. 下载与解压

  1. 官方下载Hadoop 2.7.72

https://archive.apache.org/dist/hadoop/common/hadoop-2.7.7/hadoop-2.7.7.tar.gz

  1. 上传到虚拟机(如/home/wang/soft
  2. 解压:

       tar -zxvf hadoop-2.7.7.tar.gz

3. 配置环境变量

编辑  /etc/profile,追加如下内容(不要覆盖原有PATH):

export JAVA_HOME=/home/wang/soft/jdk
export HADOOP_HOME=/home/wang/soft/hdfs/hadoop-2.7.7
export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

保存后执行:

source /etc/profile 

4. 修改Hadoop配置文件

4.1 配置 JAVA_HOME

编辑:

vi $HADOOP_HOME/etc/hadoop/hadoop-env.sh

找到export JAVA_HOME=${JAVA_HOME}

改为

export JAVA_HOME=/home/wang/soft/jdk 

(路径按实际你的JDK路径填写)

4.2 配置 core-site.xml

编辑:

vi $HADOOP_HOME/etc/hadoop/core-site.xml

在 <configuration> 标签内添加:

<property>
  <name>fs.defaultFS</name>
  <value>hdfs://localhost:9000</value>
</property> 

4.3 配置 hdfs-site.xml

编辑:

vi $HADOOP_HOME/etc/hadoop/hdfs-site.xml

在 <configuration> 标签内添加: 

<property>
  <name>dfs.replication</name>
  <value>1</value>
</property>
<property>
  <name>dfs.namenode.name.dir</name>
  <value>file:/home/wang/soft/hdfs/hadoop-2.7.7/data/nameNode</value>
</property>
<property>
  <name>dfs.datanode.data.dir</name>
  <value>file:/home/wang/soft/hdfs/hadoop-2.7.7/data/dataNode</value>
</property>

 5. 格式化HDFS(只需第一次)

hdfs namenode -format

看到successfully formatted即成功。

6. 启动Hadoop

start-dfs.sh 

如提示找不到命令,先执行source ~/.bashrc

 7. 检查进程

jps

应看到 NameNode、DataNode、SecondaryNameNode 等进程。

如果没有完全显示的话就要手动开启一下

hadoop-daemon.sh start namenode
hadoop-daemon.sh start datanode

8. Web界面访问

  • NameNode管理页面:http://你的虚拟机IP:50070
  • SecondaryNameNode:http://你的虚拟机IP:50090

9. 常用命令

  • 查看HDFS根目录:

  hdfs dfs -ls /

 上传文件到HDFS:

  hdfs dfs -put 本地文件 /目标目录

下载文件到本地:

  hdfs dfs -get /hdfs文件 本地目录 

10. 常见问题与解决

  • hadoop version 报错找不到bash

→ 修复PATH,确保/bin在PATH里,或用ln -s /bin/bash /usr/bin/bash

  • JAVA_HOME未配置或配置错

→ 检查hadoop-env.sh和环境变量,必须用绝对路径

  • 端口被占用

→ 改配置文件中的端口,或释放端口

  • 权限问题

→ 确保所有Hadoop相关目录有当前用户写权限

11. 关闭Hadoop

stop-dfs.sh

 12. 彻底卸载(如需重来)

rm -rf /home/wang/soft/hdfs/hadoop-2.7.7

http://www.dtcms.com/a/243695.html

相关文章:

  • LSTM-XGBoost回归预测,多输入单输出(Matlab完整源码和数据)
  • 洛谷B3612 【深进1.例1】求区间和
  • matlab脉冲信号并绘制波形2025.6.11
  • java每日精进 6.11【消息队列】
  • Python训练营打卡 Day51
  • Weblogic 弱口令-任意文件读取
  • 零基础设计模式——行为型模式 - 中介者模式
  • IDEA 连接 Docker 一键打镜像
  • k8s 部署服务常见错误原因
  • 【基于阿里云上Ubantu(x86-64)系统部署配置K8s】
  • Springboot+idea热更新
  • 句法分析 自然语言处理
  • springboot + nacos + k8s 优雅停机
  • redisson锁的可重入、可重试、超时续约原理详解
  • 第七章——8天Python从入门到精通【itheima】-81~82(函数的多返回值+函数多种传参方式)
  • 深入解析MySQL Join算法原理与性能优化实战指南
  • 附加模块--Qt SQL模块功能及架构解析
  • 在GIS 工作流中实现数据处理(2)
  • 小米15系列摄影进阶:100+专业级相机预设包实测与调参指南
  • Cockpit:一个开源的 Linux 系统管理工具
  • Postman核心功能解析
  • 【时时三省】(C语言基础)寄存器变量( register变量)和全局变量的存储类别
  • 顶级视频生成大模型分析:Seedance 1.0 Pro (字节跳动) - 新晋榜首
  • S2B2B农产品供应链交易多平台开发有哪些发展前景?如何维护?
  • 无线通信网络拓扑推理采样率实验(数据生成)
  • 数组——数组的遍历
  • Hive的索引使用如何优化?
  • MATLAB实现数字下变频低通滤波法
  • OpenCV CUDA模块图像变形------ 构建仿射变换的映射表函数buildWarpAffineMaps()
  • UE5 学习系类(七)导入bridge资产包