当前位置: 首页 > news >正文

Hadoop的三大结构及各自的作用?

1.HDFS 作用:

  • 存储海量数据,支持高容错(数据自动备份)和高吞吐量(适合大文件读写)。

  • 采用主从架构

    • NameNode:管理文件系统的元数据(如文件目录结构)。

    • DataNode:存储实际数据块(默认128MB/块,3副本)。

适用场景

  • 存储日志、视频、大型数据集等非结构化或半结构化数据

2.YARN 作用:

  • 资源管理:统一分配集群的CPU、内存等资源。

  • 任务调度:支持多种计算框架(如MapReduce、Spark、Flink)在同一个集群上运行。

  • 核心组件

    • ResourceManager(RM):全局资源调度。

    • NodeManager(NM):单节点资源管理。

    • ApplicationMaster(AM):单个作业的任务协调。

优势

  • 提高集群资源利用率,避免传统MapReduce的单一任务调度瓶颈。

3.MapReduce 作用:

  • 分布式批处理计算框架,通过MapReduce两个阶段处理数据。

    • Map阶段:并行处理输入数据,生成键值对(<key, value>)。

    • Reduce阶段:汇总Map的结果,输出最终数据。

特点

  • 高容错:自动处理节点故障。

  • 离线计算:适合大规模静态数据集(如日志分析、ETL)。

示例

  • 词频统计(WordCount)、数据清洗、聚合分析等。

相关文章:

  • 刀片服务器的散热构造方式
  • 游戏APP如何抵御DDoS攻击与黑客勒索?实战防护全攻略
  • 物联网分层架构全解析:从感知到应用的智能生态构建
  • day45——非递减数列(LeetCode-665)
  • Spring Boot启动流程深度解析:从main()到应用就绪的完整旅程
  • 设计模式之工厂方法模式
  • 获取印度股票市场列表、查询IPO信息以及通过WebSocket实时接收数据
  • 青少年编程与数学 02-016 Python数据结构与算法 28课题、图像处理算法
  • 人像面部关键点检测
  • 【路由交换方向IE认证】BGP选路原则之AS-Path属性
  • 基于autoware1.14的实车部署激光雷达循迹,从建图、定位、录制轨迹巡航点、到实车运行。
  • MySQL+Redis实战教程:从Docker安装部署到自动化备份与数据恢复20250418
  • MCP协议量子加密实践:基于QKD的下一代安全通信(2025深度解析版)
  • 服务器架构:SMP、NUMA、MPP及Docker优化指南
  • Oracle 19c新特性:OCP认证考试与职业跃迁的关键?
  • 日本公司如何实现B2B商城订货系统的自动化和个性化?
  • 珈和科技:无人机技术赋能智慧农业,精准施肥与病虫害监控全面升级
  • STM32F103_HAL库+寄存器学习笔记18 - CAN接收溢出中断
  • win10 应用市场 开发
  • 【java 13天进阶Day04】常用API、正则表达式,泛型、Collection集合API
  • 中办、国办印发《安全生产考核巡查办法》
  • 习近平访问金砖国家新开发银行
  • 韩国下届大选执政党初选4进2结果揭晓,金文洙、韩东勋胜出
  • 长三角铁路“五一”假期运输今启动:预计发送旅客量增6%,5月1日当天有望创新高
  • 论法的精神︱张玉敏:知识产权保护要为社会经济文化发展服务
  • 打工人的“小长假模式”,已经迫不及待地开启了