当前位置: 首页 > news >正文

cloudera manager 页面启动nodemanager失败,后端没有启动 8040

nodemanager异常失败后,cloudera manager页面启动nodemanager失败,后端没有启动8040。
问题分析:查看日志hadoop-cmf-yarn-NODEMANAGER-IT-CDH-Node36.log.out 发现
在这里插入图片描述
进程OOM,8042端口注册不上! nodemanager启动就会recovering application。
清理失败app缓存:
rm -rf /data*/yarn/nm/usercache/*
rm -rf /var/lib/hadoop-yarn/yarn-nm-recovery/*
删除cache之后 重启nodemanager正常。
问题分析:
1、由于这台机器上跑大任务,导致内存不足,报警写到/tmp目录下,产生很多大文件,进而导致磁盘不足!
2、nm重启会去cache里面 recovering任务,但是这些任务已经过时导致一直起不来,解决办法就是删除这些cache!!!

http://www.dtcms.com/a/253840.html

相关文章:

  • JWT基础概念详解
  • MySQL常用函数详解之流程函数
  • 解决你的100个问题——梦想
  • 硬编码(Reg/Opcode 和 SIB)
  • moduo之线程Thread
  • 为什么会出现 make 工程管理器?它到底能做什么?
  • [Linux_core] “虚拟文件” | procfs | devfs | 上下文
  • 前端大文件分片上传+后端(node)接收分片并合并
  • Android 网络请求的选择逻辑(Connectivity Modules)
  • 深入解析 MySQL 并发控制:读写锁、锁粒度与高级优化
  • 数据库(考前两天版本)
  • 李沐动手深度学习(pycharm中运行笔记)——11.模型选择+过拟合欠拟合
  • SQL关键字三分钟入门:UNION 与 UNION ALL —— 数据合并全攻略
  • RKNN开发环境搭建3-RKNN Model Zoo 板载部署以Whisper为例
  • pyqt 简单条码系统
  • OpenStack入门
  • 搭建简易采购系统:从需求分析到供应商数据库设计
  • 【第二章:机器学习与神经网络概述】01.聚类算法理论与实践-(2)层次聚类算法(Hierarchical Clustering)
  • 【对比】DeepAR 和 N-Beats
  • 【unitrix】 3.0 基本结构体(types.rs)
  • python 解码 jwt
  • javaweb -Ajax
  • LVS—DR模式
  • 最新FVCOM 潮流、波浪、泥沙、水质、温盐、染色剂、粒子示踪、嵌套、背景流、自动化全流程
  • 在线教育平台敏捷开发项目
  • CppCon 2017 学习:C++ in Academia
  • ModbusTcp使用
  • Qt事件处理机制
  • Transformer推理拓扑关系
  • 2025年06月18日Github流行趋势