当前位置: 首页 > news >正文

Spark,配置hadoop集群1

配置运行任务的历史服务器

1.配置mapred-site.xml

在hadoop的安装目录下,打开mapred-site.xml,并在该文件里面增加如下两条配置。

eg我的是在hadoop199上

<!-- 历史服务器端地址 -->
<property>
    <name>mapreduce.jobhistory.address</name>
    <value>hadoop100:10020</value>
</property>

<!-- 历史服务器web端地址 -->
<property>
    <name>mapreduce.jobhistory.webapp.address</name>
    <value>hadoop100:19888</value>
</property>

添加后该文件是这样的:

2.同步配置

将此文件配置同步到其他节点中命令为:

[root@hadoop100 hadoop]$ xsync $HADOOP_HOME/etc/hadoop/mapred-site.xml

3.启动历史服务器

请注意:你在配置的时候指定哪个节点是历史服务器,就在哪里启动,请不要搞错了。

对应的命令是: mapred --daemon start historyserver

4.检查历史服务器是否启动

通过jps命令来查看历史服务器是否已经成功启动了。

[root@hadoop100 hadoop]$ jps

出现下图这样即代表成功启动

5.查看JobHistory

方式1:直接去看所有的历史记录 http://hadoop100:19888/jobhistory

方式2:重新启动yarn服务从具体的history链接进行跳转。

开启日志聚集功能

1.配置yarn-site.xml

同样也是在hadoop100内找到yarn-site.xml文件,我们添加如下的配置。

在该文件里面增加如下配置。 

<!-- 开启日志聚集功能 -->
<property>
    <name>yarn.log-aggregation-enable</name>
    <value>true</value>
</property>
<!-- 设置日志聚集服务器地址 -->
<property>  
    <name>yarn.log.server.url</name>  
    <value>http://hadoop101:19888/jobhistory/logs</value>
</property>
<!-- 设置日志保留时间为7天 -->
<property>
    <name>yarn.log-aggregation.retain-seconds</name>
    <value>604800</value>
</property>

2.分发配置

和之前的配置一样,我们需要把这个更新之后的yarn-site.xml文件同步到其他的机器。这里还是使用脚本xsync。具体如下

xsync /opt/module/hadoop-3.1.3/etc/hadoop/yarn-site.xml

3.重启ResourceManager和HistoryServer

进入到我们安装yarn的主机,通过命令来关闭掉yarn和historyServer,然后再重启。

[root@hadoop103 hadoop-3.1.3]$ sbin/stop-yarn.sh

[root@hadoop103 hadoop-3.1.3]$ mapred --daemon stop historyserver

启动ResourceManage和HistoryServer

start-yarn.sh

mapred --daemon start historyserver

4.测试是否运行成功

命令如下:

[root@hadoop100 hadoop-3.1.3]$ hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.3.jar wordcount /input /output

查看日志:

如果一切正常,我们打开历史服务器地址http://hadoop101:19888/jobhistory 可以看到历史任务列表,如下:

点击对应的JobID,就可以进一步查看任务运行日志

然后在点击logs,就可以查看运行日志的详情了。

相关文章:

  • 【Easylive】Maven 多模块项目的 POM 文件配置详解
  • Java面试黄金宝典26
  • 烧结银:解锁金刚石超强散热潜力​
  • Python神经网络1000个案例算法汇总
  • UI设计中的交互技巧:如何让按钮更有反馈感?
  • 图灵完备——游戏中进行实践
  • 基础算法篇(3)(蓝桥杯常考点)-图论
  • 深入解析主线程退出与子线程管理:何时 Join(),何时 Detach()?
  • 学习记录-软件测试基础
  • 嵌入式八股RTOS与Linux--启动篇
  • 【虚拟仪器技术】Labview虚拟仪器技术应用教程习题参考答案[13页]
  • 程序化广告行业(45/89):RTB竞价后续流程、结算规则及相关要点解读
  • Centos主机检查脚本
  • 【PCIE711-214】基于PCIe总线架构的4路HD-SDI/3G-SDI视频图像模拟源
  • 设计一个分页插件
  • FOC 控制笔记【三】磁链观测器
  • Docker 完整命令速查手册
  • d2025331
  • deepseek部署
  • leetcode 2716. 最小化字符串长度 简单
  • 建设静态网站工具/网络推广长沙网络推广
  • 微信可以做网站吗/百度seo搜搜
  • 广西建设银行行号查询网站/seo标题优化裤子关键词
  • 企业做网站的意义/南宁网站建设网站推广
  • 企业网站建设分析/电商推广平台
  • 文明网站的建设与管理几点思考/重庆发布的最新消息今天