当前位置: 首页 > news >正文

【并行分布计算】Hadoop伪分布搭建

Hadoop伪分布搭建

1. 修改core-site.xml

fs.defaultFS设置的是HDFS的地址,设置运行在本地的9000端口上

hadoop.tmp.dir设置的是临时目录,如果没有设置的话默认在/tmp/hadoop-${user.name}中,系统重启后会导致数据丢失,因此修改这个临时目录的路径

创建临时目录:

[root@hadoop00 hadoop]# mkdir -p /export/servers/hadoop-2.7.6/tmp

2.修改hdfs-site.xml

dfs.replication设置的是HDFS存储的临时备份数量,因为伪分布模式中只有一个节点,所以设置为1。

3.修改hadoop-env.sh

4. 本地无密码ssh连接

(1)查看是否开启sshd服务

[root@hadoop00 hadoop]# systemctl status sshd

(2)localhost连接

(3)配置密钥认证连接

5.配置文件

(1)配置core-site.xml

[root@hadoop00 hadoop]# vi core-site.xml

(2)配置hdfs-site.xml

[root@hadoop00 hadoop]# vi hdfs-site.xml

对hdfs-site.xml进行同样的替换操作,属性的含义分别为复制的块的数量、DFS管理节点的本地存储路径、DFS数据节点的本地存储路径

(3)配置mapred-site.xml

[root@hadoop00 hadoop]# vi mapred-site.xml

yarn 是一种资源管理和作业调度技术,作为Hadoop 的核心组件之一,负责将系统资源分配给在 Hadoop 集群中运行的各种应用程序,并调度要在不同集群节点上执行的任务,其基本思想是将资源管理和作业调度/监视的功能分解为单独的 daemon,总体上yarn是 master/slave 结构,在整个资源管理框架中,ResourceManager 为 master,NodeManager 是 slaver。

(4)配置yarn-site.xml

[root@hadoop00 hadoop]# vi yarn-site.xml

配置yarn-site.xml文件,这里修改NodeManager上运行的附属服务即可:

6. 格式化后启动、调用实例、停止所有运行的hadoop进程

(1)格式化并启动

[root@hadoop00 hadoop-2.7.6]# bin/hdfs namenode -format

(2)启动全部进程

[root@hadoop00 hadoop-2.7.6]# start-all.sh

7.测试

(1)生成输入目录

bin/hdfs dfs -mkdir /user

bin/hdfs dfs -mkdir /user/root

bin/hdfs dfs -mkdir input

bin/hdfs dfs -put etc/hadoop/*.xml input(2)测试

(2)测试

hdfs dfs -put /export/servers/hadoop-2.7.6/etc/hadoop/*.xml input

(3)获取输出

相关文章:

  • 【并行分布计算】Hadoop单机分布搭建
  • ubuntu docker 创建镜像 报错 dial tcp xxxx read udp xxxx i/o timeout 还有 Forbidden
  • 秘密任务 2.0:如何利用 WebSockets + DTOs 设计实时操作
  • Redis面试——常用命令
  • 【KWDB 创作者计划】_上位机知识篇---SDK
  • Python入门安装和语法基础
  • Ubuntu多用户VNC远程桌面环境搭建:从零开始的完整指南
  • java 设计模式之代理模式
  • [形象解析] ptmalloc、tcmalloc与jemalloc对比
  • PHP序列化/反序列化漏洞原理
  • 杂记-LeetCode中部分题思路详解与笔记-HOT100篇-其三
  • 告别定时任务!用Dagster监听器实现秒级数据响应自动化
  • [ComfyUI]重磅升级,FLUX.1-dev-ControlNet-Union-Pro-2.0发布,更好用了
  • Java对接Dify API接口完整指南
  • 吴恩达深度学习复盘(19)XGBoost简介|神经网络与决策树
  • openai发布今天发布了o3和o4-mini。
  • Selenium 实现自动化分页处理与信息提取
  • 【JavaEE】Maven配置
  • (leetcode算法题)309. 买卖股票的最佳时机含冷冻期
  • 【音视频】音视频FLV合成实战
  • 中国华能:1-4月新能源装机突破1亿千瓦,利润总额再创新高
  • 河南通报部分未检疫生猪流入:立案查处,涉案猪肉被封存
  • 三件珍贵标本开箱!中国恐龙大展5月26日在沪开幕,明星标本汇聚一堂
  • 竞彩湃|英超欧冠悬念持续,纽卡斯尔诺丁汉能否拿分?
  • 信俗与共:清代新疆回疆儒释道庙宇的中华政教
  • 3月中国减持189亿美元美债、持仓规模降至第三,英国升至第二