当前位置: 首页 > news >正文

HDFS的概述

HDFS组成构架:

注:

NameNode(nn):就是 Master,它是一个主管、管理者。

(1) 管理 HDFS 的名称空间;

(2) 配置副本策略。记录某些文件应该保持几个副本;

(3) 管理数据块(Block)映射信息; 一个大文件可能有多个数据块(一块为128M),每个块保存在哪里

(4) 处理客户端读写请求。

DataNode:就是 Slave。NameNode 下达命令,DataNode 执行实际的操作。

(1) 存储实际的数据块;

(2) 执行数据块的读 / 写操作。

Secondary NameNode:并非 NameNode 的热备。当 NameNode 挂掉的时候,它并不能马上替换 NameNode 并提供服务。 真实的开发中,我们会配置两个个namenode来实现高可用。

(1) 辅助 NameNode,分担其工作量,比如定期合并 Fsimage 和 Edits,并推送给 NameNode;

(2) 在紧急情况下,可辅助恢复 NameNode。

Client:就是客户端。 

(1)文件上传 HDFS 的时候,Client 将文件切分成一个一个的 Block,然后进行上传;

(2)与 NameNode 交互,获取文件的位置信息;

(3)与 DataNode 交互,读取或者写入数据;

(4) Client 提供一些命令来管理 HDFS,比如 NameNode 格式化;

(5) Client 可以通过一些命令来访问 HDFS,比如对 HDFS 增删查改操作;

HDFS文件默认大小是128M

shell操作文件上传

1.从本地剪切粘贴到HDFS。把本地的文件上传到HDFS,并删除本地的文件。假设你在hadoop102上有一个文件/opt/conf/sanguo.txt(请自行创建)。

基本格式是:

hadoop fs -moveFormLocal  (本地文件路径 服务器上的文件路径)

可以通过如下命令把这个文件上传到服务器上。

[root@hadoop100 hadoop-3.1.3]$ hadoop fs  -moveFromLocal  /opt/tmp/sanguo.txt  /sanguo.txt

注意到,它会把本地的文件删除掉。

2.如果要保留本地的文件,可以使用 -put 命令。具体如下:

[root@hadoop100 hadoop-3.1.3]$ hadoop fs -put /opt/tmp/sanguo.txt /sanguo

shell操作文件下载

下载就是把集群中的文件下载到本地。它要用到的命令是hadoop fs -get。

基本格式是:

hadoop fs -get  (服务器上的文件路径 本地文件路径)

示例需求: 把服务器上的shuguo.txt 下载到hadoop100的 files目目录下。

对应的命令:

[root@hadoop100 hadoop-3.1.3]$ hadoop fs -get /sanguo/shuguo.txt ./shuguo2.txt

其他shell操作

1.显示目录信息。

使用-ls命令,示例如下:

[root@hadoop100 hadoop-3.1.3]$ hadoop fs -ls /

上面的命令用来查看根目录(/)下的文件。

2.创建文件夹。

使用-mkdir命令。格式是:hadoopfs -mkdir 文件名。 示例如下:

[root@hadoop100 hadoop-3.1.3]$ hadoop fs -mkdir /jinguo

3.显示文件内容。

使用-cat命令。示例如下:

[root@hadoop100 hadoop-3.1.3]$ hadoop fs -cat /sanguo/shuguo.txt

3.拷贝文件。

使用-cp命令。表示从HDFS的一个路径拷贝到HDFS的另一个路径

[root@hadoop100 hadoop-3.1.3]$ hadoop fs -cp /sanguo/shuguo.txt /jinguo

4.移动文件。

使用-mv命令,它的格式是: hadoop fs -mv 文件起点 终点

[root@hadoop100 hadoop-3.1.3]$ hadoop fs -mv /sanguo/wuguo.txt /jinguo

[root@hadoop100 hadoop-3.1.3]$ hadoop fs -mv /sanguo/weiguo.txt /jinguo

5.删除文件或文件夹。

使用-rm 命令,它的格式是: -rm 要删除的文件

[root@hadoop100 hadoop-3.1.3]$ hadoop fs -rm /sanguo/shuguo.txt

6.递归删除。

使用-rm -r命令, 它用来删除目录及目录里面内容,它的格式是: -rm -r 要删除的文件夹。

[root@hadoop102 hadoop-3.1.3]$ hadoop fs -rm -r /sanguo

7.统计文件夹的大小信息。使用命令 -du。

http://www.dtcms.com/a/193077.html

相关文章:

  • 竞品分析是什么,包括哪些内容?AI竞品分析生成器推荐!
  • 人工智能、深度学习、机器学习的联系与区别
  • 英语学习笔记
  • Java零基础学习Day14——面向对象进阶
  • 算法图表总结:查找、排序与递归(含 Mermaid 图示)
  • ORACLE 11.2.0.4 数据库磁盘空间爆满导致GAP产生
  • 力扣.1471数组的k个最强值,力扣.1471数组的k个最强值力扣1576.替换所有的问号力扣1419.数青蛙​编辑力扣300.最长递增子序列
  • 小程序映射逻辑处理
  • day 17 无监督学习之聚类算法
  • 各编程语言对正则表达式标准的支持对比
  • Python生成器:高效处理大数据的秘密武器
  • k8s(12) — 版本控制和滚动更新(金丝雀部署理念)
  • 集合进阶2
  • opencv4.11编译Debug提示缺少python312_d.lib或python3*_d.lib的解决办法
  • 金仓数据库使用sys_walfile_name函数时的时间线问题排查指南
  • C++ 基础知识点
  • Prometheus监控系统部署
  • 机器视觉对位手机中框点胶的应用
  • 普通IT的股票交易成长史--20250515复盘
  • linux系统服务
  • 康耐视VisionPro脚本开发实战教程
  • ArcGIS Pro调用多期历史影像
  • 爬虫原理与实战指南
  • 安全牛报告解读《低空经济发展白皮书(3.0)安全体系》
  • 《无限暖暖》画质测评
  • 养生:健康生活的极简攻略
  • 英语六级听力
  • Spring框架核心技术深度解析:JDBC模板、模拟转账与事务管理
  • 信息系统运行管理员:临阵磨枪版
  • 专项智能练习(定义判断)_DA_01