当前位置: 首页 > news >正文

CentOS 7 上安装 Hadoop 集群的详细教程

以下是在 CentOS 7 上安装 Hadoop 集群的详细教程:

一、环境准备

  1. 硬件环境:至少需要三台物理机或虚拟机。
  2. 软件环境:所有节点安装 CentOS 7 操作系统,关闭防火墙和 SELinux。
    systemctl stop firewalld
    systemctl disable firewalld
    setenforce 0
    

二、网络配置

  1. 配置主机名和 IP 映射

    • 在所有节点上编辑 /etc/hosts 文件,添加集群节点的 IP 和主机名映射。例如:
      192.168.10.100 hadoop100
      192.168.10.101 hadoop101
      192.168.10.102 hadoop102
      
    • 修改各节点的主机名,例如在 hadoop100 上执行:
      hostnamectl set-hostname hadoop100
      
  2. 配置静态 IP:编辑 /etc/sysconfig/network-scripts/ifcfg-ens33 文件(网卡名称可能不同),设置静态 IP。

三、安装 JDK

  1. 上传 JDK 安装包:将 JDK 安装包(如 jdk-8u241-linux-x64.tar.gz)上传到主节点的 /opt 目录下。
  2. 解压并配置环境变量
    cd /opt
    tar zxvf jdk-8u241-linux-x64.tar.gz
    mv jdk1.8.0_241 jdk1.8
    echo "export JAVA_HOME=/opt/jdk1.8" >> /etc/profile
    echo "export PATH=\$PATH:\$JAVA_HOME/bin" >> /etc/profile
    echo "export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar" >> /etc/profile
    source /etc/profile
    
  3. 分发 JDK 到其他节点
    scp -r jdk1.8 root@hadoop101:/opt
    scp -r jdk1.8 root@hadoop102:/opt
    

四、配置 SSH 免密登录

  1. 生成密钥对:在主节点执行以下命令生成密钥对:
    ssh-keygen -t rsa
    
    按提示操作,直接回车即可。
  2. 分发公钥:将生成的公钥分发到所有节点:
    ssh-copy-id hadoop101
    ssh-copy-id hadoop102
    

五、安装 Hadoop

  1. 上传 Hadoop 安装包:将 Hadoop 安装包(如 hadoop-2.7.2.tar.gz)上传到主节点的 /opt/server 目录下。
  2. 解压 Hadoop
    cd /opt/server
    tar zxvf hadoop-2.7.2.tar.gz
    
  3. 配置环境变量
    echo "export HADOOP_HOME=/opt/server/hadoop-2.7.2" >> /etc/profile
    echo "export PATH=\$PATH:\$HADOOP_HOME/bin:\$HADOOP_HOME/sbin" >> /etc/profile
    source /etc/profile
    
  4. 修改 Hadoop 配置文件
    • hadoop-env.sh:设置 JDK 路径。
      vi /opt/server/hadoop-2.7.2/etc/hadoop/hadoop-env.sh
      export JAVA_HOME=/opt/jdk1.8
      
    • core-site.xml:设置 NameNode 地址和临时目录。
      <configuration>
        <property>
          <name>fs.defaultFS</name>
          <value>hdfs://hadoop100:9000</value>
        </property>
        <property>
          <name>hadoop.tmp.dir</name>
          <value>/opt/server/hadoop-2.7.2/data/tmp</value>
        </property>
      </configuration>
      
    • hdfs-site.xml:设置 NameNode 和 DataNode 的存储路径。
      <configuration>
        <property>
          <name>dfs.replication</name>
          <value>3</value>
        </property>
        <property>
          <name>dfs.namenode.name.dir</name>
          <value>/opt/server/hadoop-2.7.2/hdfs/name</value>
        </property>
        <property>
          <name>dfs.datanode.data.dir</name>
          <value>/opt/server/hadoop-2.7.2/hdfs/data</value>
        </property>
      </configuration>
      
    • yarn-site.xml:配置 ResourceManager。
      <configuration>
        <property>
          <name>yarn.resourcemanager.hostname</name>
          <value>hadoop100</value>
        </property>
        <property>
          <name>yarn.nodemanager
      
      
http://www.dtcms.com/a/106368.html

相关文章:

  • 华为2024年营收逼近历史峰值:终端业务复苏、智能汽车爆发式增长
  • Leetcode hot 100(day 3)
  • HDMI接口类型介绍
  • 在openharmony中部署helloworld应用(超详细)
  • 线段树,单点,区间修改查阅
  • 酶动力学预测工具CataPro安装教程
  • Rabbit:流加密的 “极速赛车手”
  • 单例模式与线程安全
  • 每日算法-250402
  • SESSION_UPLOAD_PROGRESS 的利用
  • Spark、Flink 和 TensorFlow 三大分布式数据处理框架对比
  • 微服务架构技术栈选型避坑指南:10大核心要素深度拆解
  • 供应链中的的“四流合一”
  • 以太网报文结构 via ethernetPacket in CAPL
  • 三轴云台之相机技术篇
  • JavaWeb开发基础知识-Servlet终极入门指南(曼波萌新版)
  • KingbaseES物理备份还原之物理备份
  • 单框架鸿蒙开发
  • 解决报错curl: (35) OpenSSL SSL_connect: 连接被对方重设 in connection to download.docker.com:443
  • JavaScript闭包
  • Python设计模式:责任链模式
  • JAVASE(十三)常用类(二)包装类、工具类Arrays类
  • 【案例分享】江苏某汽车制造厂水冷式制冷站AI节能优化方案
  • LVS-----DR模式
  • JAVA中JVM一次 GC的 流程
  • 电脑屏幕亮度随心控,在Windows上自由调整屏幕亮度的方法
  • 分布式数据一致性场景与方案处理分析|得物技术
  • 谷粒商城:Redisson
  • TiDB 可观测性解读(二)丨算子执行信息性能诊断案例分享
  • Linux网络编程socket服务器端模拟实现