当前位置: 首页 > news >正文

配置Hadoop集群-上传文件

上传小文件

上传文件的时候,我们传一个大一点的(>128M),再传一个小一点的。对于大一点的文件,我们要去看看它是否会按128M为单位去拆分这个大文件,而拆分成大文件之后,我们又怎么才能去还原?

下面我们来看具体操作:

打开hadoop100:9870,点击上传,选择我们需要上传的文件(建议选择一个简单的文本文件),上传之后的结果如下:

命令格式如下:

hadoop fs -put 要上传的文件  目标位置

下面我们上传一个小文件,你可以自己去找一个文本文件,或者自己创建一个都可以。cd

上传小文件(小于128M)

[root@hadoop100 ~]$ hadoop fs -mkdir /input

[root@hadoop100 ~]$ hadoop fs -put $HADOOP_HOME/wcinput/word.txt /input

上传大文件(大于128M)

[root@hadoop100 ~]$ hadoop fs -put  /opt/software/jdk-8u212-linux-x64.tar.gz  /

上传文件后查看文件存放在什么位置

在我们上一节的hadoop配置中,我们设置了保持文件的目录是/data,所以,我们进入hadoop的按照目录下的data中去看一看。

这个存储的目录特别深,大概类似于:/opt/module/hadoop-3.1.3/data/dfs/data/current/BP-1436128598-192.168.10.102-1610603650062/current/finalized/subdir0/subdir0

文件的名称是blk_xxx。我们可以使用cat命令查看HDFS在磁盘存储文件内容

[root@hadoop102 subdir0]$ cat blk_1073741825

hadoop yarn

hadoop mapreduce

root

root

上传大文件

前面我们上传了一个小文件,可以看到这个文件太小,hadoop被没有被切分成小块。接下来我们传一个大一点的文件,例如jdk的安装包。(注意,你可以上传一些别的文件,但是务必确保大小是大于128M)

我们把它保存在集群的根目录。

上传完成之后,我们去查看,很明显大文件被分块了,128M一块,一共有两个块。可以通过cat >> 命令把两个块的内容拼接到一起,然后再去解压缩一下。

类似于如下:

-rw-rw-r--. 1 root root 134217728 5  23 16:01 blk_1073741836

-rw-rw-r--. 1 root root   1048583 5  23 16:01 blk_1073741836_1012.meta

-rw-rw-r--. 1 root root  63439959 5  23 16:01 blk_1073741837

-rw-rw-r--. 1 root root    495635 5  23 16:01 blk_1073741837_1013.meta

[root@hadoop102 subdir0]$ cat blk_1073741836>>tmp.tar.gz

[root@hadoop102 subdir0]$ cat blk_1073741837>>tmp.tar.gz

[root@hadoop102 subdir0]$ tar -zxvf tmp.tar.gz

相关文章:

  • 基于Java和PostGIS的AOI面数据球面面积计算实践
  • 【SpringBoot】从零开始全面解析Spring MVC (一)
  • Ascend的aclgraph(六)AclConcreteGraph
  • [经验总结]删除gitlab仓库分支报错:错误:无法推送一些引用到“http:”
  • c语言第一个小游戏:贪吃蛇小游戏06
  • Visual Studio 项目 .gitignore 文件指南
  • 在 Qt Creator 中为 QDockWidget 设置隐藏和显示按钮
  • 通过anaconda安装jupyter
  • 【Redis 进阶】缓存
  • Mac显卡的工作原理及特殊之处
  • 【 Redis | 实战篇 秒杀实现 】
  • 移动端(手机)ECharts 的myChart.on(‘click‘,还生效吗我怎么触发不了,没得鼠标触发不了点击事件
  • Qt事件循环机制
  • 光谱相机的光电信号转换
  • lubuntu 系统详解
  • 【FMMT】基于模糊多模态变压器模型的个性化情感分析
  • 访问层架构设计:第二篇
  • 大模型中的KV Cache
  • 思迈特软件携手天阳科技,打造ChatBI金融智能分析新标杆
  • 【并发编程基石】CAS无锁算法详解:原理、实现与应用场景
  • 秦洪看盘|交易新逻辑,银行股成A股稳定器
  • 人才争夺战,二三线城市和一线城市拼什么?洛阳官方调研剖析
  • 真人秀《幸存者》百万美元奖金,25年间“缩水”近一半
  • 高适配算力、行业大模型与智能体平台重塑工业城市
  • 男子退机票被收90%的手续费,律师:虽然合规,但显失公平
  • 书法需从字外看,书法家、学者吴本清辞世