当前位置: 首页 > news >正文

hadoop集群的常用命令

1. HDFS 文件系统操作

-查看目录/文件列表

  hdfs dfs -ls /path/to/directory

  创建目录

  hdfs dfs -mkdir /path/to/new_directory

  上传文件到 HDFS

   hdfs dfs -put local_file /hdfs/path/

 - 下载文件到本地

   hdfs dfs -get /hdfs/path/file local_path

  - 删除文件或目录

  hdfs dfs -rm /hdfs/path/file # 删除文件

  hdfs dfs -rm -r /hdfs/path/directory # 递归删除目录

  - **查看文件内容**  

   hdfs dfs -cat /hdfs/path/file

  hdfs dfs -tail /hdfs/path/file

  - **复制/移动文件**  

  hdfs dfs -cp /source /destination

  hdfs dfs -mv /source /destination

  - **检查 HDFS 空间使用**  

  hdfs dfs -df -h # 查看整体空间

  hdfs dfs -du -h /path # 查看目录大小

 

---

2. YARN 资源管理

- 提交 MapReduce 作业

 hadoop jar example.jar MainClass -input /input -output /output

 - **查看运行中的应用列表**  

 yarn application -list

 - **终止应用**  

 yarn application -kill application_id

 - **查看节点状态**  

   yarn node -list

 - **查看容器日志**  

 yarn logs -applicationId application_id

 

---

3. 集群管理命令

- 检查 HDFS 健康状态

 hdfs dfsadmin -report # 显示 DataNode 状态

  hdfs fsck / # 检查文件系统完整性

 - 进入/退出安全模式 

 hdfs dfsadmin -safemode enter # 进入安全模式(维护时使用)

  hdfs dfsadmin -safemode leave # 退出安全模式

 - 平衡 DataNode 磁盘数据

 hdfs balancer -threshold 10 # 阈值 10% 的磁盘差异

 - 查看 NameNode 日志

 tail -f $HADOOP_HOME/logs/hadoop-*-namenode-*.log

---

4. 高级工具

- 跨集群复制数据 (DistCp)

 hadoop distcp hdfs://source-cluster/path hdfs://target-cluster/path

 - 合并小文件为 HAR 归档

hadoop archive -archiveName myhar.har -p /input/path /output/path

 - 检查 HDFS 副本数 

hdfs dfs -setrep -w 3 /path/file # 修改副本数为 3

---

5. 常用快捷命令

- 查看 HDFS 根目录

 hdfs dfs -ls /

 - 查看集群版本**  

hadoop version

- 格式化 NameNode (谨慎使用)

  hdfs namenode -format # 仅初始化新集群时使用

相关文章:

  • 《Spring Boot全栈开发指南:从入门到生产实践》
  • JAVA反序列化深入学习(十一):Spring1
  • 【Pandas】pandas Series to_latex
  • 力扣hot100_贪心算法
  • 实现基于Vue的后台管理系统权限控制与动态路由
  • 【避坑指南】RAGFlow + Ollama + Deepseek 构建本地知识库
  • 逻辑损失以及梯度下降的实现
  • Docker学习--容器操作相关命令--docker logs 命令
  • 利用 SSRF 和 Redis 未授权访问进行内网渗透
  • Java 中数组转集合的方法
  • 分布式环境下的主从数据同步
  • SpringBoot事务管理(四)
  • Faster-Whisper —— 为语音识别加速的利器
  • 283. 移动零
  • 【QT】Qt4 QtWebKit使用教程
  • 数据结构与算法-双指针法
  • Java 大视界 -- 基于 Java 的大数据可视化在城市规划决策支持中的交互设计与应用案例(164)
  • 30-超市进销存管理系统
  • RAG 高效检索利器 打造企业 “规章制度智能体”(ollama + deepseek + langchain + MinerU)
  • 力扣经典算法篇-5-多数元素(哈希统计,排序,摩尔投票法)
  • 南沙定制型网站建设/如何软件网站优化公司
  • dw怎么做鲜花网站/天津seo招聘
  • 盐湖网站制作/高端网站优化公司
  • wordpress hook/谷歌seo博客
  • 网站点击排名/全网最好的推广平台
  • 格泰网站建设/深圳全网营销系统