当前位置: 首页 > news >正文

为什么badmin reconfig以后始终不能提交任务

最近遇到的怪事:修改了openlava配置以后运行badmin reconfig激活配置变更,但是长时间始终不能提交任务。

首先查看进程,发现openlava管理节点上的所有服务进程都在运行状态;查看mbd日志没有发现错误信息;再看mbd进程的系统调用(strace -p mbd_pid)发现始终在读取lsb.events文件;再通过gdb -p mbd_pid 查看调用栈发现 读取lsb.events的行号始终在增长。再通过wc -l lsb.events发现文件有2500000+行数据,至此不能提交任务的原因比较清楚了,MBD一直忙于恢复集群状态,在状态恢复之前不会响应其它请求,包括提交任务、查询等。

终于在一个多小时的等待后集群恢复正常。

进一步查看集群配置,发现CLEAN_PERIOD参数设为7天,从而导致大量任务保存在lsb.events文件中。而reconfig是其实是重启MBD服务,MBD在重启过程中首先要读取lsb.events中的记录,根据读取的记录恢复集群状态。

因此要解决此问题,可行的方法就是减少CLEAN_PERIOD,建议保持默认值3600秒。

相关文章:

  • C#语音录制:使用NAudio库实现语音录制功能详解
  • 【CBAP50技术手册】#32 Organizational Modelling(组织建模):BA(业务分析师)的“变革导航图”
  • Ubuntu取消开机用户自动登录
  • Practice 2025.6.1—— 二叉树进阶面试题(2)
  • Python爬虫:AutoScraper 库详细使用大全(一个智能、自动、轻量级的网络爬虫)
  • GNSS终端授时之四:高精度的PTP授时
  • JDBC连不上mysql:Unable to load authentication plugin ‘caching_sha2_password‘.
  • 通俗易懂的 JS DOM 操作指南:从创建到挂载
  • uniapp uni-id 如果是正式项目,需自行实现发送邮件的相关功能
  • 【Java基础】Java基础语法到高级特性
  • WEBSTORM前端 —— 第3章:移动 Web —— 第5节:响应式网页
  • Python 训练营打卡 Day 41
  • 船舶二阶非线性响应方程的EKF与UKF参数辨识
  • 使用BERT/BiLSTM + CRF 模型进行NER进展记录~
  • PyTorch ——torchvision数据集使用
  • 缓存击穿、缓存雪崩、缓存穿透以及数据库缓存双写不一致问题
  • 落石石头检测数据集VOC+YOLO格式1185张1类别
  • 【MySQL】第13节|MySQL 中模糊查询的全面总结
  • Mixly1.0/2.0/3.0 (windows系统) 安装教程及使用常见问题解决
  • leetcode179_最大数
  • 做那种的视频网站有哪些/长春百度推广排名优化
  • wordpress版本替换/搜狗seo怎么做
  • 做网站要多少像素/产品线下推广方式都有哪些
  • 国内域名注册商/名风seo软件
  • 响应式网站建设哪家公司好/关键词热度查询工具
  • 常州网站建设公司报价/优质的seo网站排名优化软件