当前位置: 首页 > news >正文

Hadoop容错机制详解

Hadoop NameNode 高可用(High Availability, HA)通过 Active-Standby 架构自动故障切换(Failover) 解决单点故障问题,确保 NameNode 服务持续可用。以下是其详细过程:


1. HA 核心组件

  • Active NameNode:处理所有客户端请求(元数据读写、块位置查询等)。
  • Standby NameNode:实时同步 Active NameNode 的元数据,随时准备接管服务。
  • JournalNode 集群(JNs):轻量级分布式服务(通常 3 或 5 个节点),负责存储和管理 EditLog(元数据操作日志)。
  • ZooKeeper 集群(ZK):协调故障检测与切换,管理 NameNode 的 Active 状态。
  • 共享存储(Shared Storage):通过 JournalNode 实现 EditLog 的共享(替代传统 HA 中的 NFS)。

2. HA 工作流程

(1) 元数据同步(EditLog 共享)
  • 写入 EditLog
    Active NameNode 将元数据操作(如创建、删除文件)写入 EditLog,并同步到多个 JournalNode(需大多数节点确认,例如 3 节点中至少 2 个确认)。
  • Standby 读取 EditLog
    Standby NameNode 定期从 JournalNode 读取最新的 EditLog,并合并到本地的 FsImage(文件系统镜像),保持与 Active 的元数据一致。
(2) 故障检测与切换
  • 心跳机制
    Active NameNode 定期通过 ZooKeeper 发送心跳信号(称为 ZKFC,ZooKeeper Failover Controller)。
  • 故障判定
    若 ZKFC 在超时时间内未收到心跳(默认 5 秒),ZooKeeper 认为 Active NameNode 失效,触发自动故障切换。
  • 选举新 Active
    ZooKeeper 通过分布式锁机制选举新的 Active NameNode:
    1. Standby NameNode 检查当前是否持有锁(即是否有权成为 Active)。
    2. 若原 Active 失效,Standby 获取锁并升级为 Active。
    3. 新 Active 接管服务,更新元数据并通知 DataNode。
(3) DataNode 块报告
  • DataNode 同时向 ActiveStandby NameNode 发送块位置报告(Block Report),确保两者均掌握数据块分布。
  • 在故障切换后,新 Active NameNode 无需等待 DataNode 重新上报,可直接处理请求。

3. 自动故障切换(Failover)的详细步骤

  1. 检测故障
    • ZooKeeper 发现 Active NameNode 心跳超时。
    • ZKFC 触发健康检查(如 NameNode 进程是否存活、网络是否可达)。
  2. 隔离原 Active(Fencing)
    • 防止原 Active NameNode 恢复后产生“脑裂”(Split Brain),强制终止其进程或断开网络。
    • 常见隔离机制:SSH 远程杀死进程、调用脚本禁用网络端口。
  3. 元数据状态确认
    • 确保 Standby NameNode 的元数据是最新的(通过 JournalNode 确认 EditLog 完全同步)。
  4. 切换为 Active
    • Standby NameNode 升级为 Active,接管客户端请求。
    • 更新 ZooKeeper 中的 Active 状态标识。
  5. 客户端重定向
    • 客户端通过重试机制或配置的 HA 代理(如 HDFS HA 的逻辑 URI)自动连接到新 Active NameNode。

4. 手动切换(Graceful Failover)

  • 运维人员可通过命令手动触发 Active/Standby 切换(如集群维护场景):
    hdfs haadmin -transitionToActive --forcemanual <namenode_id>
    
  • 手动切换前需确保元数据已完全同步。

5. 关键配置

  1. hdfs-site.xml
    <!-- 启用 HA -->
    <property><name>dfs.nameservices</name><value>mycluster</value>
    </property>
    <!-- 定义 NameNode ID -->
    <property><name>dfs.ha.namenodes.mycluster</name><value>nn1,nn2</value>
    </property>
    <!-- JournalNode 地址 -->
    <property><name>dfs.namenode.shared.edits.dir</name><value>qjournal://jn1:8485;jn2:8485;jn3:8485/mycluster</value>
    </property>
    <!-- 故障切换代理类 -->
    <property><name>dfs.client.failover.proxy.provider.mycluster</name><value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
    </property>
    
  2. core-site.xml
    <!-- 使用逻辑 URI 访问 HDFS(隐藏物理 NameNode 地址) -->
    <property><name>fs.defaultFS</name><value>hdfs://mycluster</value>
    </property>
    

6. 注意事项

  • JournalNode 高可用:至少部署 3 个 JournalNode(容忍 1 个节点故障)或 5 个(容忍 2 个故障)。
  • 隔离机制(Fencing):必须配置可靠的隔离策略,避免脑裂问题。
  • 监控与告警:监控 ZooKeeper、JournalNode 和 NameNode 的健康状态,及时发现潜在故障。

7. HA 架构的优势

  • 零停机时间:故障切换通常在 数十秒内 完成,客户端无感知。
  • 数据一致性:通过 JournalNode 保障元数据的强一致性。
  • 无缝扩展:支持滚动升级(Rolling Upgrade)和在线维护。

NameNode HA 是 Hadoop 2.x 及后续版本的核心特性,显著提升了 HDFS 的可靠性,适用于对服务连续性要求严苛的生产环境。

相关文章:

  • Hadoop常用端口号和配置文件
  • 前端性能优化:如何让网页加载更快?
  • 《软件工程》第 13 章 - 软件维护
  • linux centos 服务器性能排查 vmstat、top等常用指令
  • 明达技术亮相第19届北京物流运输展,共话智能仓储物流未来
  • OceanBase数据库从原理到实战(安全与权限篇)
  • 使用Python解析CGNS文件中的zone-zone链接信息
  • Linux常见设备
  • Ethan的日记5/26
  • 【MogDB】测试 ubuntu server 22.04 LTS 安装mogdb 5.0.11
  • SpringBoot(四)--- Mybatis、PageHelper、事务
  • 入驻面包多了
  • 著名诗人王小青作品欣赏
  • ASCII码对应表
  • 第12次06 :用户中心添加邮箱
  • 算法题(156):雷达探测
  • 【低代码平台】数据交换格式:JSON vs. Protobuf 协议对比
  • 【某数WAF 动态Cookie实战】
  • MyBatis 动态 SQL 详解:灵活构建强大查询
  • git基础语法回顾
  • 成都华阳有没有做网站的/网站优化的方法
  • 网站模板被抄袭怎么办/seo销售话术开场白
  • 手机wap网站怎样从微信公众号打开/中牟网络推广
  • 新乡网站自然优化/德州网站建设优化
  • 千岛湖网站建设/seo优化网站网页教学
  • 内部网站开发/推广神器