当前位置: 首页 > news >正文

Hadoop集群组成

(一)Hadoop的组成
        对普通用户来说, Hadoop就是一个东西,一个整体,它能给我们提供无限的磁盘用来保存文件,可以使用提供强大的计算能力。
        在Hadoop3.X中,hadoop一共有三个组成部分:MapReduce,Yarn,HDFS。它们的作用如下:
1. MapReduce: 用来提供计算。
2. HDFS: 用来提供文件存储功能。
3. Yarn: 用来协调调度。
(二)HDFS
        Hadoop Distributed File System, 简称HDFS,是一个分布式文件系统。在hadoop体系中,它用来存储文件。
  例如,当我们把一个文件(例如500M),保存到hadoop中时,它的背后要实现两个效果:
1. 如果文件较大(>128M)把大文件拆小,并分别传输。
2. 存储3份在不同的主机上。
        在它的内部,有三个角色,分别如下:
        (1)NameNode(nn):存储文件的元数据,如文件名,文件目录结构,文件属性(生成时间,副本数,文件权限),以及每个文件的块列表和块所在的DataNode等。
        (2)DataNode(dn):在本地文件系统存储文件块数据,以及块数据的校验和。
        (3)Secondary NameNode(2nn): 每隔一段时间对NameNode元数据备份。

HDFS集群:一主加三从,额外再配一个小秘书

YARN

Yet Another Resource Negotiator,简称YARN,另一种资源协调者,是Hadoop的资源管理器。

(1)ResourceManager(RM):整个集群资源(内存,CPU等)的管理者

(2)NodeManager(NM): 单个节点服务器资源的管理者

Yarn和HDFS的关系说明:逻辑上分离物理上在一起

逻辑上分离不是说非要启动HDFS集群才能启动YARN集群,不是先有哪个再有哪个?每个框都是一个进程,可能都运行在一台主机上,但是,属于不同的集群。

物理上在一起:每一台机器上都有NN, NM。

(四)MapReduce

MapReduce用来提供计算的能力。它将计算过程分为两个阶段:Map和Reduce

(1)Map阶段并行处理输入数据

(2)Reduce阶段对Map结果进行汇总

相关文章:

  • pyyaml_include 2.x 版本使用说明
  • 因果推荐|可解释推荐系统的反事实语言推理
  • 玩转github
  • Spring Cloud Config 快速介绍与实例
  • KV 缓存简介
  • 力扣Hot100——169. 多数元素
  • 低空经济腾飞:无人机送货、空中通勤,未来已来
  • Spring Cloud 负载均衡(Ribbon)- 流量管理与服务调用优化
  • LeetCode134☞加油站
  • 07-单链表-单链表基本操作
  • 【Pandas】pandas Series cat
  • 【计算机网络】浏览器组成、工作原理、页面渲染流程...
  • 国内首款载重1吨级无人运输机TP1000首飞成功 2026年投入应急救援
  • CAN总线的CC帧和FD帧之间如何仲裁
  • 2025-03-17 NO.1 Quest3 开发环境配置教程
  • 初阶数据结构习题【16】(5二叉树)——965. 单值二叉树
  • langchain如何并行调用运行接口
  • 代码随想录算法训练营第六十五天| 图论10
  • 《Android启动侦探团:追踪Launcher启动的“最后一公里”》
  • 设计模式之抽象工厂模式
  • 美国中央情报局计划裁员1200人
  • 5月资金面前瞻:政府债净融资规模预计显著抬升,央行有望提供流动性支持
  • 特朗普宣布提名迈克·沃尔兹为下一任美国驻联合国大使
  • 据报特斯拉寻找新CEO,马斯克财报会议上表态:把更多时间投入特斯拉
  • 王受文已任中华全国工商业联合会领导班子成员
  • “上博号”彩绘大飞机今日启航:万米高空传播中国古代文化