当前位置: 首页 > wzjs >正文

渭南市建设工程有限责任公司网络优化网站

渭南市建设工程有限责任公司,网络优化网站,邱县专业做网站,iis7wordpress第一课时 一、导入 前面的课程我们搭建了hadoop集群,并成功启动了它,接下来我们看看如何去使用集群。 测试的内容包括:1.上传文件,2.下载文件,3.运行程序 二、授新 (一)上传小文件 上传文件的时…

第一课时

一、导入

前面的课程我们搭建了hadoop集群,并成功启动了它,接下来我们看看如何去使用集群

测试的内容包括:1.上传文件,2.下载文件,3.运行程序

二、授新

上传小文件

上传文件的时候,我们传一个大一点的(>128M),再传一个小一点的。对于大一点的文件,我们要去看看它是否会按128M为单位去拆分这个大文件,而拆分成大文件之后,我们又怎么才能去还原?

下面我们来看具体操作:

打开hadoop100:9870,点击上传,选择我们需要上传的文件(建议选择一个简单的文本文件),上传之后的结果如下:

命令格式如下:

hadoop fs -put 要上传的文件  目标位置

下面我们上传一个小文件,你可以自己去找一个文本文件,或者自己创建一个都可以。cd

上传小文件(小于128M)

[root@hadoop100 ~]$ hadoop fs -mkdir /input

[root@hadoop100 ~]$ hadoop fs -put $HADOOP_HOME/wcinput/word.txt /input

上传大文件(大于128M)

[root@hadoop100 ~]$ hadoop fs -put  /opt/software/jdk-8u212-linux-x64.tar.gz  /

查看上传的小文件

上传文件后查看文件存放在什么位置

在我们上一节的hadoop配置中,我们设置了保持文件的目录是/data,所以,我们进入hadoop的按照目录下的data中去看一看。

这个存储的目录特别深,大概类似于:/opt/module/hadoop-3.1.3/data/dfs/data/current/BP-1436128598-192.168.10.102-1610603650062/current/finalized/subdir0/subdir0

文件的名称是blk_xxx。我们可以使用cat命令查看HDFS在磁盘存储文件内容

[root@hadoop102 subdir0]$ cat blk_1073741825

hadoop yarn

hadoop mapreduce

root

root

上传大文件

前面我们上传了一个小文件,可以看到这个文件太小,hadoop被没有被切分成小块。接下来我们传一个大一点的文件,例如jdk的安装包。(注意,你可以上传一些别的文件,但是务必确保大小是大于128M)

我们把它保存在集群的根目录。

上传完成之后,我们去查看,很明显大文件被分块了,128M一块,一共有两个块。可以通过cat >> 命令把两个块的内容拼接到一起,然后再去解压缩一下。

类似于如下:

-rw-rw-r--. 1 root root 134217728 5月  23 16:01 blk_1073741836
-rw-rw-r--. 1 root root   1048583 5月  23 16:01 blk_1073741836_1012.meta
-rw-rw-r--. 1 root root  63439959 5月  23 16:01 blk_1073741837
-rw-rw-r--. 1 root root    495635 5月  23 16:01 blk_1073741837_1013.meta
[root@hadoop102 subdir0]$ cat blk_1073741836>>tmp.tar.gz
[root@hadoop102 subdir0]$ cat blk_1073741837>>tmp.tar.gz
[root@hadoop102 subdir0]$ tar -zxvf tmp.tar.gz

还原成功

集群基本测试-下载

上传的文件我们完成了,那怎么去下载呢? 方法很简单,可以直接在页面上操作。点击对应的下载按钮就可以了。

第二课时

前面我们学习了文件相关的操作,接下来我们看看如何去执行程序,是不是有分布式的效果。我们在前面的课程中使用单机运行模式测试使用了wordcount这个功能,下面我们仍以它为例,来看看如何进行分布式的执行。

(五)执行wordcount程序

具体的操作步骤如下:

  1. 确保hadoop是正确运行的。hdfs和yarn都正常启动了。
  2. 在集群根目录下创建wcinput目录,并在它的下面上传两个文本文件word1.txt, word2.txt,其中保存了要测试的单词信息。
  3. 在任意一台设备中,进入到hadoop的主目录。cd /opt/modele/hadoop-3.1.3
  4. 运行如下命令:

hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.3.jar wordcount /wcinput /output

        5、在如下网站查看运行的过程和记录http://hadoop101:8088/cluster

6、查看运行结果,在文件系统中查看。

三、课堂小结

通过本堂课的学习,我们学习了hadoop集群配置完成之后的基本组成,测试了上传小文件,大文件和执行程序时的状态。

http://www.dtcms.com/wzjs/187884.html

相关文章:

  • 凡科免费建设企业网站靠谱吗西安市网站
  • 企业网站一般用什么程序做360优化大师官方网站
  • 如何做网站?种子搜索神器 bt 下载
  • 南开做网站公司2022年热点营销案例
  • 湖南常德市人民政府网百度竞价和优化的区别
  • 玉环做网站有哪些太原seo快速排名怎么样
  • 汪峰做的音乐网站seo公司服务
  • 群辉做网站服务器最新国际军事动态
  • 网站中滚动条怎么做近三天发生的重要新闻
  • 网站建设开发多少钱百度推广网址是多少
  • 旅游网站开发网站设计报告书长沙网站托管优化
  • python 做网站缺点百度指数数据分析平台
  • 惠州做网站公司百度电商平台
  • 桓台网站建设应用商店下载
  • 佛山市外贸企业高端网站设计网站推广技巧和方法
  • 用wordpress开发网站模板西安做网页的公司
  • 福州市网站建设seo快速排名软件推荐
  • 加工厂网站建设网页设计流程步骤
  • 项目管理appseo关键词排名优化系统源码
  • 设计网站专业代写文案的公司
  • 网站 新闻同步骤更新 ecshop知识营销成功案例介绍
  • 广州 营销型网站建设公司找培训班一般在什么平台
  • 开发一款游戏需要多少资金谷歌广告优化师
  • 安庆做网站爱站站长工具
  • 优秀电商网站设计seo快速优化排名
  • 网站优化北京黄山网站建设
  • wordpress主题如何使用教程seo黑帽教程视频
  • 龙岗大运做网站的公司网站建设加推广优化
  • flash网站用什么做seo外链是什么意思
  • 帮别人做网站服务器网络推广深圳有效渠道