当前位置：首页 > news >正文

【并行分布计算】Hadoop伪分布搭建

news 2025/10/17 10:22:19

Hadoop伪分布搭建

1. 修改core-site.xml

fs.defaultFS设置的是HDFS的地址，设置运行在本地的9000端口上

hadoop.tmp.dir设置的是临时目录，如果没有设置的话默认在/tmp/hadoop-${user.name}中，系统重启后会导致数据丢失，因此修改这个临时目录的路径

创建临时目录：

[root@hadoop00 hadoop]# mkdir -p /export/servers/hadoop-2.7.6/tmp

2.修改hdfs-site.xml

dfs.replication设置的是HDFS存储的临时备份数量，因为伪分布模式中只有一个节点，所以设置为1。

3.修改hadoop-env.sh

4. 本地无密码ssh连接

（1）查看是否开启sshd服务

[root@hadoop00 hadoop]# systemctl status sshd

（2）localhost连接

（3）配置密钥认证连接

5.配置文件

（1）配置core-site.xml

[root@hadoop00 hadoop]# vi core-site.xml

（2）配置hdfs-site.xml

[root@hadoop00 hadoop]# vi hdfs-site.xml

对hdfs-site.xml进行同样的替换操作，属性的含义分别为复制的块的数量、DFS管理节点的本地存储路径、DFS数据节点的本地存储路径

（3）配置mapred-site.xml

[root@hadoop00 hadoop]# vi mapred-site.xml

yarn 是一种资源管理和作业调度技术，作为Hadoop 的核心组件之一，负责将系统资源分配给在 Hadoop 集群中运行的各种应用程序，并调度要在不同集群节点上执行的任务，其基本思想是将资源管理和作业调度/监视的功能分解为单独的 daemon，总体上yarn是 master/slave 结构，在整个资源管理框架中，ResourceManager 为 master，NodeManager 是 slaver。

（4）配置yarn-site.xml

[root@hadoop00 hadoop]# vi yarn-site.xml

配置yarn-site.xml文件，这里修改NodeManager上运行的附属服务即可：

6. 格式化后启动、调用实例、停止所有运行的hadoop进程

（1）格式化并启动

[root@hadoop00 hadoop-2.7.6]# bin/hdfs namenode -format

（2）启动全部进程

[root@hadoop00 hadoop-2.7.6]# start-all.sh

7.测试

（1）生成输入目录

bin/hdfs dfs -mkdir /user

bin/hdfs dfs -mkdir /user/root

bin/hdfs dfs -mkdir input

bin/hdfs dfs -put etc/hadoop/*.xml input（2）测试

（2）测试

hdfs dfs -put /export/servers/hadoop-2.7.6/etc/hadoop/*.xml input

（3）获取输出

http://www.dtcms.com/a/138050.html

相关文章：

【并行分布计算】Hadoop单机分布搭建

ubuntu docker 创建镜像报错 dial tcp xxxx read udp xxxx i/o timeout 还有 Forbidden

秘密任务 2.0：如何利用 WebSockets + DTOs 设计实时操作

Redis面试——常用命令

【KWDB 创作者计划】_上位机知识篇---SDK

Python入门安装和语法基础

Ubuntu多用户VNC远程桌面环境搭建：从零开始的完整指南

java 设计模式之代理模式

[形象解析] ptmalloc、tcmalloc与jemalloc对比

PHP序列化/反序列化漏洞原理

杂记-LeetCode中部分题思路详解与笔记-HOT100篇-其三

告别定时任务！用Dagster监听器实现秒级数据响应自动化

[ComfyUI]重磅升级，FLUX.1-dev-ControlNet-Union-Pro-2.0发布，更好用了

Java对接Dify API接口完整指南

吴恩达深度学习复盘(19)XGBoost简介|神经网络与决策树

openai发布今天发布了o3和o4-mini。

Selenium 实现自动化分页处理与信息提取

【JavaEE】Maven配置

（leetcode算法题）309. 买卖股票的最佳时机含冷冻期

【音视频】音视频FLV合成实战

界面开发框架DevExpress XAF实践：如何在Blazor项目中集成.NET Aspire？(一)

拖拉拽效果加点击事件

智慧交通内容及发展趋势概述

第五章 SQLite数据库：6、SQLite 常用语法1

【数据结构】AVL树

主数据管理：企业数字化转型的 “数据基石“ 如何为 AI 筑基？

Google Mock（GMock）：C++单元测试的高效模拟框架详解

D4707同步整流器：提升Flyback转换器效率的关键元件

本地Ubuntu轻松部署高效性能监控平台SigNoz与远程使用教程

Django 实现物联网管理系统的详细方案