当前位置: 首页 > news >正文

【Linux】Hadoop-3.4.1的伪分布式集群的初步配置

配置步骤

一、检查环境

  • JDK
# 目前还是 JDK8 最适合 Hadoop
java -version
echo $JAVA_HOME
  • Hadoop
hadoop version
echo $HADOOP_HOME

    二、配置SSH免密登录

    Hadoop需要通过SSH管理节点(即使在伪分布式模式下)

    sudo apt install openssh-server    # 安装SSH服务(如未安装)
    
    cd ~/.ssh/
    
    ssh-keygen -t rsa    # 生成密钥对
    
    cat ./id_rsa.pub >> ./authorized_keys    # 添加公钥到授权列表
    
    ssh localhost    # 测试免密登录(首次可能需输入yes)
    
    ssh-copy-id xxx
    ssh xxx

    三、修改Hadoop核心配置文件

    进入配置文件目录:

    cd $HADOOP_HOME/etc/hadoop
    # 手动创建文件夹
    mkdir -p /opt/software/hadoop/data/tmp
    mkdir -p /opt/software/hadoop/data/logs
    mkdir -p /opt/software/hadoop/data/namenode
    mkdir -p /opt/software/hadoop/data/datanode
    • hadoop-env.sh
    vim hadoop-env.sh
    
    # 在文件最后一行加上
    export JAVA_HOME="/usr/lib/jvm/java-8-openjdk-amd64"
    export HADOOP_CONF_DIR=/opt/software/hadoop/etc/hadoop
    export HADOOP_LOG_DIR=/opt/software/hadoop/data/logs
    export HADOOP_PID_DIR=/opt/software/hadoop/data/tmp
    • yarn-env.sh
    vim hadoop-env.sh
    
    # 在文件最后一行加上
    export JAVA_HOME="/usr/lib/jvm/java-8-openjdk-amd64"
    • mapred-env.sh

    vim mapred-env.sh
    
    # 在文件最后一行加上
    export JAVA_HOME="/usr/lib/jvm/java-8-openjdk-amd64"

    把环境刷新一下

    source hadoop-env.sh
    source yarn-env.sh
    source mapred-env.sh
    • core-site.xml

    <configuration>
        <!-- 指定 NameNode 通信的地址 -->
        <property>
            <name>fs.defaultFS</name>
            <value>hdfs://hadoop01:8020</value>
        </property>
        <!-- 指定 hadoop 运行过程中临时数据的存储目录 -->
        <property>
            <name>hadoop.tmp.dir</name>
            <value>/opt/software/hadoop/data/tmp</value>
        </property>
    </configuration>
    • hdfs-site.xml

    <configuration>
        <!-- NameNode 存放元数据的本地目录-->
        <property>
            <name>dfs.namenode.name.dir</name>
            <value>/opt/software/hadoop/data/namenode</value>
        </property>
        <!-- NameNode web 端访问地址-->
        <property>
            <name>dfs.namenode.http-address</name>
            <value>hadoop01:9870</value>
        </property>
        <!-- Datanode 在本地存储 block 块的目录 -->
        <property>
            <name>dfs.datanode.data.dir</name>
            <value>/opt/software/hadoop/data/datanode</value>
        </property>
        <!-- HDFS blocksize block 块大小 -->
        <property>
            <name>dfs.blocksize</name>
            <value>134217728</value>
        </property>
        <!-- HDFS blocksize 也就是 block 的副本数-->
        <property>
            <name>dfs.replication</name>
            <value>2</value>
        </property>
    </configuration>
    • mapred-site.xml

    <configuration>
        <!-- 指定 MapReduce 程序运行在 Yarn 上 -->
        <property>
            <name>mapreduce.framework.name</name>
            <value>yarn</value>
        </property>
    </configuration>
    • yarn-site.xml

    <configuration>
        <!-- 指定 MR 走 shuffle -->
        <property>
            <name>yarn.nodemanager.aux-services</name>
            <value>mapreduce_shuffle</value>
        </property>
        <!-- 环境变量的继承 -->
        <property>
            <name>yarn.nodemanager.env-whitelist</name>
            <value>JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HA
            DOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_H
            OME,HADOOP_MAPRED_HOME</value>
        </property>
    </configuration>

    四、初始化与启动Hadoop

    • 格式化HDFS
    hdfs namenode -format
    
    # 成功标志:Storage directory ... has been successfully formatted
    • 启动HDFS和YARN
    start-dfs.sh   # 启动NameNode和DataNode
    start-yarn.sh  # 启动ResourceManager和NodeManager
    • jps 验证进程
    jps

    结束

    http://www.dtcms.com/a/84541.html

    相关文章:

  • MiB和MB
  • 多层感知机
  • Java 输入1~100的整数,当读入负数时结束,统计输出每个数的数量
  • Linux中mutex机制
  • 如何在云端平台上建立 30,000 名用户的网页 MMO游戏环境-4 (OOM Killer 问题與雲平台!?)
  • AT_abc398_f [ABC398F] ABCBA
  • 哈尔滨工业大学DeepSeek公开课人工智能:从图灵测试到DeepSeek|附视频和PPT下载方法
  • 2025-03-22 学习记录--C/C++-C 库函数 - getchar()
  • [Android] ViiTor_Translate_2.2.5实时语音翻译软件,多国语言全解决
  • 数据库基础知识
  • React:React主流组件库对比
  • 分子动力学软件包Amber24的安装
  • miniconda安装保姆级教程|win11|深度学习环境配置
  • 颠覆者的困局:解构周鸿祎商业哲学中的“永恒战争”
  • python——UI自动化(1) selenium之介绍和环境配置
  • Bell-1量子计算机分析:开启量子计算2.0时代的创新引擎
  • 安装React开发者工具
  • Windows Once Power-v2.21.0+0-开源文件和文件夹批量重命名工具
  • Windows Server 2025 使用 IIS 搭建 ASP.NET 3.5 网站
  • 【STM32实物】基于STM32的扫地机器人/小车控制系统设计
  • 在线问卷调查|在线问卷调查系统|基于Spring Boot的在线问卷调查系统的设计与实现(源码+数据库+文档)
  • 电脑系统问题检查
  • 从像素到世界:自动驾驶视觉感知的坐标变换体系
  • MyBatis-Plus 自动填充:优雅实现创建/更新时间自动更新!
  • AI比人脑更强,因为被植入思维模型【16】反脆弱
  • 【vue的some和filter】
  • 3-22 vector的使用详解---STL C++
  • 免费下载 | 2025年AI产业全景报告.pdf
  • 手机怎么换网络IP有什么用?操作指南与场景应用‌
  • 常考计算机操作系统面试习题(四)