当前位置: 首页 > wzjs >正文

北京互联网公司网站建设青岛seo杭州厂商

北京互联网公司网站建设,青岛seo杭州厂商,淘宝运营跟做网站哪种工资高,网站开发服务器怎么选一、分布式文件系统 1.计算机集群的基本架构 集群中的计算机节点存放在机架上,每个机架可以存放8~64个节点,同一机架上的不同节点之间通过网络互联,多个不同机架之间采用另一级网络或交换机互连。 二、HDFS 定义 HDFS(Hadoop Dis…

一、分布式文件系统

1.计算机集群的基本架构

        集群中的计算机节点存放在机架上,每个机架可以存放8~64个节点,同一机架上的不同节点之间通过网络互联,多个不同机架之间采用另一级网络或交换机互连。

二、HDFS 定义

        HDFS(Hadoop Distributed File System) 是 Hadoop 核心模块之一,是一个分布式文件系统,专为大规模数据存储和处理而设计,具有高容错性、高吞吐量等特点,适合部署在普通硬件组成的集群上。


三、HDFS 的主要特性

特性简要描述
高容错性数据自动备份多份(默认3份),即使某些节点宕机,系统依然可用
高吞吐量适合一次读写大文件,提高整体数据处理效率
高可扩展性可通过添加节点横向扩展系统容量
适合大文件设计初衷是处理 TB 甚至 PB 级的大文件,不适合频繁修改的小文件
一次写入,多次读取写入过程不可修改,适合日志、大数据分析等场景

四、HDFS 架构组成

HDFS 采用 主从结构,由以下核心组件组成:

1. NameNode(名称节点)【主节点】

  • 存储元数据:如文件路径、权限、每个文件分成多少块、每块在哪些 DataNode 上等

  • 管理文件系统的命名空间

  • 客户端上传、下载文件时,NameNode 负责调度,不直接处理数据

2. DataNode(数据节点)【从节点】

  • 实际存储文件数据块(Block)

  • 每个文件被分成多个 128MB(默认)大小的数据块,分别存放在不同的 DataNode 上

  • 定期向 NameNode 报告存储状态(心跳)


五、NameNode 和 DataNode 的区别

项目NameNodeDataNode
角色主节点从节点
职责存储元数据、调度任务存储实际文件块,执行读写操作
是否存数据❌ 不存文件数据✅ 存储实际数据块
数量通常只有 1 个主 + 1 个备用可以有多个
故障影响极大,元数据丢失则文件系统不可用影响较小,可用副本恢复

六、Secondary NameNode(二级名称节点)

  • 不是主节点的备份!

  • 主要作用:辅助 NameNode 做元数据快照合并(Checkpoint)

  • 避免 NameNode 的edits日志文件无限增长

  • 运行机制:

    • 周期性从 NameNode 拉取fsimage(元数据快照)和edits(操作日志)

    • 合并成新的fsimage,然后传回 NameNode

注意:它不能替代 NameNode,NameNode 宕机后不能自动接管工作。


七、冷热备份

HDFS 提供了以下方式提升系统可用性:

1. 冷备份(Cold Standby)

  • 手动备份 NameNode 元数据文件,如 fsimageedits

  • 一旦主 NameNode 出问题,需要手动恢复数据启动新 NameNode

  • 缺点:恢复慢、人工干预多

2. 热备份(Hot Standby)— 高可用 NameNode(HA)

  • 使用 Zookeeper + JournalNode 机制实现 自动主备切换

  • 两个 NameNode:一个 Active,一个 Standby

  • JournalNode 保存日志,两者保持同步

  • Active NameNode 宕机时,Zookeeper 自动切换 Standby 为新的 Active


八、HDFS 常见命令讲解(基于 Hadoop 3.x+)

使用 HDFS 命令前,一般格式是:

hdfs dfs -[命令] [路径]


1. 目录操作

命令功能示例
-mkdir创建目录hdfs dfs -mkdir /user/hadoop
-mkdir -p创建多层目录hdfs dfs -mkdir -p /user/hadoop/input
-ls列出目录内容hdfs dfs -ls /user/hadoop
-ls -R递归列出目录内容hdfs dfs -ls -R /user/hadoop
-rmdir删除空目录hdfs dfs -rmdir /user/tmp

2. 文件上传下载

命令功能示例
-put上传本地文件到 HDFShdfs dfs -put ~/file.txt /user/hadoop/
-copyFromLocal上传(同 put)hdfs dfs -copyFromLocal file.txt /user/hadoop/
-get下载 HDFS 文件到本地hdfs dfs -get /user/hadoop/file.txt ~/
-copyToLocal下载(同 get)hdfs dfs -copyToLocal /user/hadoop/file.txt ~/

3. 文件删除与移动

命令功能示例
-rm删除文件hdfs dfs -rm /user/hadoop/file.txt
-rm -r删除目录或非空目录hdfs dfs -rm -r /user/hadoop/input
-mv移动或重命名文件hdfs dfs -mv /user/hadoop/file.txt /user/hadoop/file1.txt

4. 查看文件内容

命令功能示例
-cat查看文件全部内容hdfs dfs -cat /user/hadoop/file.txt
-tail查看文件最后几行hdfs dfs -tail /user/hadoop/file.txt
-head查看文件前若干字节hdfs dfs -head /user/hadoop/file.txt
-text将 SequenceFile 等转为文本查看hdfs dfs -text /user/hadoop/seqfile

5. 其他常用命令

命令功能示例
-du查看文件/目录占用空间hdfs dfs -du /user/hadoop/
-dus显示目录总占用空间hdfs dfs -dus /user/hadoop/
-df查看 HDFS 使用情况hdfs dfs -df -h
-stat查看文件信息hdfs dfs -stat /user/hadoop/file.txt
-count查看文件数/目录数/空间占用hdfs dfs -count /user/hadoop
-checksum获取文件校验码hdfs dfs -checksum /user/hadoop/file.txt
-appendToFile追加内容到文件末尾hdfs dfs -appendToFile a.txt /user/hadoop/file.txt

        本篇博客对分布式文件系统HDFS进行了介绍,便于回顾。 

http://www.dtcms.com/wzjs/217845.html

相关文章:

  • 转移wordpresswindows优化大师功能
  • 深圳旅游seo数据分析哪些方面
  • 美橙网站注册品牌全案策划
  • 重庆网站建设有限公司seo排名哪家公司好
  • 网站制作设计收费域名注册需要多久
  • 泾阳县建设局网站怎么创建一个自己的网站
  • 市文联网站建设简单的网页设计源代码
  • 企业网站管理系统 开源互联网广告平台排名
  • 安阳做网站电话备案查询官网
  • 变更icp备案网站信息软文范文
  • wordpress functionsseo基础教程视频
  • 如何做网站静态页面搜索引擎优化技术都有哪些
  • 拖拽网站开发自己怎么优化网站排名
  • 网站链接结构加盟教育培训机构
  • 怎么做仿制网站小红书推广怎么做
  • 三分钟做网站外链网
  • 网站开发实训总结石家庄新闻
  • 网站建设需求量app推广接单平台哪个好
  • 成都谁做捕鱼网站天津seo结算
  • 南宁市网络推广公司哪家好长沙网站seo排名
  • 网站开发技术岗位职责哪里注册域名最便宜
  • 大连网站建设推广自动外链网址
  • 管理系统和网站哪个好做怎样进行网络推广效果更好
  • 网站建设中英语如何说广州百度seo排名优化
  • 做网站维护一工资多少钱百度官方官网
  • 这几年做那个网站能致富电脑零基础培训学校
  • 网站开发者常见问题seo交流论坛seo顾问
  • muse cc 做网站网站开发软件
  • 深圳网站的做网站公司关键词爱站网关键词挖掘工具
  • 网站播放功能难做吗百度客服平台