当前位置: 首页 > wzjs >正文

网站集约化建设会议互联网公司排名咸阳

网站集约化建设会议,互联网公司排名咸阳,国家企业信用信息公示网查询,电子商务网站业务流程图注:文中涉及到的“doubinqian"为本人姓名,大家按实际需求自行更改一、启动集群,在客户端查看集群信息进入hadoop目录,输入以下命令启动相关服务sbin/start-dfs.sh:启动 HDFS(分布式文件系统&#xff0…

注:文中涉及到的“doubinqian"为本人姓名,大家按实际需求自行更改

一、启动集群,在客户端查看集群信息

进入hadoop目录,输入以下命令启动相关服务

  • sbin/start-dfs.sh:启动 HDFS(分布式文件系统)相关进程,包括:

    NameNode(主节点,运行在 master):管理文件系统元数据(如目录结构、文件位置),是 HDFS 的 "大脑"。DataNode(从节点,运行在 slave1、slave2、slave3):存储实际数据块(Block),并根据 NameNode 指令进行数据读写。Secondary NameNode(运行在 master):辅助 NameNode 备份元数据,避免元数据丢失(非热备,仅定期合并编辑日志)。

  • sbin/start-yarn.sh:启动 YARN(资源管理器)相关进程,负责集群资源(内存、CPU)的分配与管理:

    ResourceManager(运行在 master):全局资源调度,接收应用程序提交并分配资源。NodeManager(运行在 slave 节点):管理单个节点的资源,启动和监控容器(Container)。

  • sbin/mr-jobhistory-daemon.sh start historyserver:启动 MapReduce 历史服务器,用于记录和查询已完成的 MapReduce 任务日志(通过 Web 界面访问)

sbin/start-dfs.sh
sbin/start-yarn.sh
sbin/mr-jobhistory-daemon.sh start historyserver

根据自己所用hadoop版本客户端端口号,在客户端查看集群信息

二、HDFS基本操作训练

(一)HDFS操作的基本逻辑

在开始具体操作前,先明确几个关键概念,帮助理解为什么 HDFS 操作是这样设计的:

  • 分布式存储:HDFS 中的文件不是存在一台机器上,而是被拆分成多个 “数据块(Block)”,存储在集群中的多台 “数据节点(DataNode)” 上,默认每个块大小为 128MB(文档中可看到此配置)。
  • 副本机制:为了防止数据丢失,每个数据块会被复制多份(文档中默认是 3 份),分别存在不同的 DataNode 上。
  • 命令格式:HDFS 的操作命令统一以 hdfs dfs 开头,后面跟具体操作(如创建目录、上传文件),类似 Linux 的 ls mkdir 等命令,但需要通过 HDFS 的客户端工具执行。

(二)具体操作详解

1. 创建目录:hdfs dfs -mkdir 

使用命令hdfs dfs -mkdir 创建目录/user/root/doubinqian

该命令只能在已有目录下创建目录,命令hdfs dfs -mkdir -p /user/root/text/doubinqian 则可以新建text目录的同时在其下新建子目录doubinqian

  • 命令解析

    • hdfs dfs:固定前缀,表示通过 HDFS 客户端执行操作。
    • -mkdir:创建目录的参数(类似 Linux 的 mkdir)。
    • /user/root/doubinqian:HDFS 中的目标目录路径,这是一个 “绝对路径”(从根目录/开始)。

查看是否被成功创建

2. 上传文件:hdfs dfs -put 

使用命令hdfs dfs -put,将/opt目录下的movies.dat、users.dat、rating.data上传至HDFS系统的/user/root/doubinqian目录下

  • 命令解析

    • -put:上传文件的参数。
    • movies.dat:本地 Linux 系统中的文件路径(文档中该文件在/opt目录下,所以实际执行时是在/opt目录下运行的命令)。
    • /user/root/doubinqian/movies.dat:HDFS 中的目标路径,指定了文件名(也可以省略文件名,直接写目录,会默认用原文件名)

(1)上传movies.dat

(2)上传users.dat

(3)上传ratings.dat

(4)客户端查看上传结果

  • 通过 Web 界面查看/user/root/doubinqian目录,显示三个文件:

    • movies.dat(大小 167.29KB)、user.dat(131.24KB)、ratings.dat(23.46MB)。
    • 每个文件的 “Replication”(副本数)都是 3,这是 HDFS 默认的副本配置(保证数据安全,即使某台 DataNode 故障,还有其他副本可用)。
    • “Block Size”(块大小)都是 128MB,由于这三个文件都小于 128MB,所以每个文件只占 1 个数据块。

3. 下载文件:hdfs dfs -get

使用命令hdfs dfs -get 从HDFS上下载users.dat文件到Linux本地目录/opt/doubinqian/中

  • 命令解析

    • -get:下载文件的参数。
    • /user/root/doubinqian/users.dat:HDFS 中的源文件路径。
    • /opt/doubinqian/:本地 Linux 的目标目录(如果目录不存在,需要先在本地创建,比如用mkdir /opt/doubinqian)。

下载成功

4. 删除文件:hdfs dfs -rm 

使用hdfs dfs -rm 命令,删除HDFS上/user/root/doubinqian/目录下的users.dat文件

如果要删除整个目录,需要加 -r 参数(递归删除目录及其中的所有内容),例如删除doubinqian目录:hdfs dfs -rm -r /user/root/doubinqian

以下仅演示删除users.dat文件

    在客户端查看是否删除

(三)补充:常用的HDFS辅助命令

1.查看目录内容hdfs dfs -ls <路径>

例如:显示/user/root/doubinqian目录下的所有文件(如文档中上传后的三个文件):

hdfs dfs -ls /user/root/doubinqian 

2.查看文件内容hdfs dfs -cat <文件路径>

例如:直接查看 HDFS 中文件的内容(适合小文件):

hdfs dfs -cat /user/root/doubinqian/movies.dat

3.复制 HDFS 中的文件hdfs dfs -cp <源路径> <目标路径>

例如:将movies.dat复制到另一个目录/tmp

hdfs dfs -cp /user/root/doubinqian/movies.dat /tmp/

4.移动 HDFS 中的文件hdfs dfs -mv <源路径> <目标路径>

类似 “剪切粘贴”,例如将ratings.dat移动到/tmp

hdfs dfs -mv /user/root/doubinqian/ratings.dat /tmp/

http://www.dtcms.com/wzjs/551440.html

相关文章:

  • 郑州制作网站软件制作相册影集
  • 内容相同的 网站ios应用开发语言
  • 网站栏目管理建设设计师服务平台卡密号
  • 网站管理员在哪里教师遭网课入侵直播录屏曝光口
  • 动漫建模代做网站百度一下会务网站建设
  • 赣州南康网站建设wordpress微信防红插件下载
  • 在线可以做翻译的网站吗网站开发形式
  • 网站建设展滔科技大厦天进机械东莞网站建设
  • 淄博网站优化推广免费咨询医师
  • 网站开发和运行 法律二级目录 网站
  • 蚌埠网站建设费用深圳市大鹏建设局网站
  • 网站开发用linuxseo的作用有哪些
  • 网站建设几种语言对比企信网企业信息查询平台官网
  • seo站外优化平台如何建立公司网站模块
  • 网站前台建设需要哪些技术知识汉源网站建设
  • 网站开发顶岗报告设计网名姓氏
  • 做网站生意旁网站建设优化开发公司
  • 做好网站建设通知杭州外贸网站建设公司排名
  • 网站建立多少钱做网站的系统设计
  • 报名网站建设费用价格效果图
  • 广州站在哪里电商app开发多少钱
  • 技智网站建设小编海南彩票网站开发
  • wordpress 5.0.1成都优化网站
  • 北京做兼职从哪个网站wordpress freehao123
  • 烟台网站优化沈阳企业网站seo公司
  • 济南哪家公司可以做网站昆明seo网站排名
  • 怎样用编程语言做网站个人快速建站
  • 网站怎么做404页面wordpress 分类导航
  • 怎么用电脑给域名做网站时事新闻最新
  • 帝国后台网站如何设置自动刷新首郑州品牌网站建设官网