当前位置: 首页 > news >正文

搭建分布式Hadoop集群[2025] 实战笔记

文章目录

  • 一、实战目标
  • 二、集群规划
    • 1. 集群拓扑结构
    • 2. 角色分配
    • 说明:
  • 三、环境准备
    • 1. 修改 SSH 端口(安全加固)
    • 操作步骤(所有节点执行):
    • 2. FinalShell 连接配置
    • 3. 防火墙配置
    • 启动并配置 firewalld:
    • 关闭并禁用防火墙(生产环境建议精细配置,测试环境可关闭):
  • 四、系统基础配置(所有节点)
    • 1. 设置主机名
    • 2. 配置 hosts 映射
    • 3. 关闭防火墙(再次确认)
    • 4. 关闭 SELinux
  • 五、配置免密登录(关键步骤)
    • 1. 生成密钥对(在 master 节点执行)
    • 2. 分发公钥到所有节点
    • 3. 验证免密登录
    • 4. 查看密钥文件(可选)
  • 六、安装与配置 JDK
    • 1. 上传并解压 JDK
    • 2. 配置环境变量
    • 3. 验证安装
  • 七、安装与配置 Hadoop
    • 1. 上传并解压 Hadoop
    • 2. 配置环境变量
    • 3. 配置 Hadoop 环境文件
    • 4. 配置 core-site.xml
    • 5. 配置 hdfs-site.xml
    • 6. 配置 mapred-site.xml
    • 7. 配置 yarn-site.xml
    • 8. 配置 workers 文件(原 slaves)
  • 八、分发配置到从节点
    • 1. 分发 JDK
    • 2. 分发 Hadoop
    • 3. 分发系统配置文件
    • 4. 从节点刷新配置
  • 九、格式化 NameNode
  • 十、启动 Hadoop 集群
    • 1. 启动所有服务
    • 2. 查看进程
  • 十一、访问 Web UI 验证集群状态
    • 1. HDFS Web UI(9870端口)
    • 2. YARN Web UI(8088端口)
  • 十二、关闭 Hadoop 集群
  • 十三、常见问题与解决方案
  • 十四、总结

在这里插入图片描述

一、实战目标

搭建一个高可用的完全分布式 Hadoop 集群,基于 Hadoop 3.3.4 版本,包含 1 个主节点(master)和 2 个从节点(slave1、slave2),实现 HDFS 分布式存储与 YARN 分布式资源调度,支持后续大数据应用开发与部署。


二、集群规划

1. 集群拓扑结构

节点类型 主机名 IP 地址(示例)
主节点(Master) master 192.168.219.250
从节点(Slave) slave1 192.168.219.251
从节点(Slave) slave2 192.168.219.252
http://www.dtcms.com/a/362592.html

相关文章:

  • 【golang长途旅行第36站】golang操作Redis
  • 【自记】Python 中 简化装饰器使用的便捷写法语法糖(Syntactic Sugar)示例
  • ARM汇编记忆
  • 【53页PPT】华为制造行业数字化转型工业互联网智能制造解决方案(附下载方式)
  • MySQL事务+MVCC(精简版,包教包废)
  • 2025华为最值得入的耳机,真的赢麻了!
  • 结构抗震与土木工程研究
  • SylixOS 下的信号系统
  • Vue 3 + TypeScript 现代前端开发最佳实践(2025版指南)
  • Chrome浏览器调用ActiveX控件之allWebOffice在线编辑控件
  • JD潜在前端二面高频题解析
  • mysql5.6+分页时使用 limit+order by 会出现数据重复问题
  • 蓝桥杯算法之基础知识(5)
  • 基于Spark的新冠肺炎疫情实时监控系统_django+spider
  • 数据结构与算法个人学习代码笔记包含leetcode,海贼oj,蓝桥杯,ACM
  • 华为Fit4:腕间助手,守护你的健康,带你开启智慧生活
  • 【字节拥抱开源】 UXO 团队开源 USO: 通过解耦与奖励学习实现的统一风格与主题驱动生成
  • 2025最新“Java 面试八股文 + 各大厂的面试真题”限时开源
  • 美团 LongCat 开源大模型60 亿参数 MoE 架构,赋能开发者加速 AI 应用落地
  • 本地搭建并使用 Redmine 详细教程
  • CICD 持续集成与持续交付
  • SGLang推理引擎--高效的开源部署方案
  • 【第四章:大模型(LLM)】09.最强开源大模型:Llama3 原理介绍与实现-(6)Llama2 Llama3代码实现
  • Wifi开发上层学习1:实现一个wifi搜索以及打开的app
  • 零依赖每月工作计划备忘录:高效管理你的每一天
  • Qt 创建的C++ 桌面程序 学习笔记1
  • Elasticsearch创建索引分片和副本大小建议
  • iOS XML 处理利器:CNXMLParser 与 CNXMLDocument 深度解析
  • iOS15如何绕过MDM锁?详细图文教程教你搞定
  • 数据结构:基数排序 (Radix Sort)