当前位置: 首页 > news >正文

GaussDB生产扩容引起的PANIC问题处理案例

1 环境信息

CPU:8C

内存:64G

GaussDB版本:24.7.32

解决方案部署形态:HCS

部署形态:1主1从1日志

扩容原因:当前的配置满足不了max_connections为2000值,即当前的业务最大连接数超过2000个而按照8C64G的配置最多满足600的连数据数,经沟通扩容到32C128G。

2 问题现象

服务器扩完容之后,GaussDB启动失败,3个节点状态为down,情况如下:

查看dn日志:

PANIC: proc_init_process numa_run_node_mask fail

3 分析过程

查看ffic日志:

cd $GAUSSLOG/ffic_log

vim gaussdb-2025-08-29-232343.log

使用命令查看:gs_cgroup -P

GaussDB只绑了0-7核,还有8~31核没有绑上。

4 处理方法

使用gs_cgroup -u -T Gaussdb -f命令绑上0-31核。

注:0-31:代表CPU的核数

最后执行gs_ssh命令将所有节点批量修改完成:

如下:

gs_ssh -c "gs_cgroup -u -T Gaussdb -f 0-31"

最后重启GaussDB服务:

cm_ctl start

http://www.dtcms.com/a/359064.html

相关文章:

  • 重叠IO模型
  • MySQL基础理解入门
  • 微服务架构中的 “双保险“:服务保护与分布式事务解决方案实战
  • 执行一条Select语句流程
  • Linux从入门到进阶--第四章--Linux使用操作
  • 深度学习核心损失函数详解:交叉熵、MSE、对比学习(InfoNCE)
  • Linux中的Shell编程 第一章
  • TechPowerUp GPU-Z中文版:专业显卡检测工具
  • 分分合合,门模块方案又兴起了
  • 架构进阶——解读 69页 方法轮IT规划培训 架构-重点-细节【附全文阅读】
  • FFmpeg音视频处理解决方案
  • 互联网大厂面试:大模型应用开发岗位核心技术点解析
  • CSS基础学习第二天
  • 算法之x数之和
  • nginx配置websock请求,wss
  • GooglePlay提审问题记录
  • 生成式BI工具(WrenAI)
  • 防抖与节流的区别及实现【JS核心】
  • 恶补DSP:3.F28335的ePWM模块
  • 语义分割目前还是研究热点吗?
  • 【CF】Day136——Codeforces Round 1046 (Div. 2) CD (动态规划 | 数学)
  • 血氧检测原理与算法
  • Linux系统直接查询文件或目录绝对路径的方式
  • TensorFlow 深度学习 | 使用底层 API 实现模型训练(附可视化与 MLP)
  • HyperPlonk 的硬件友好性
  • Linux kernel 多核启动
  • LINUX-网络编程-TCP-UDP
  • Python 入门 Swin Transformer-T:原理、作用与代码实践
  • AI + 行业渗透率报告:医疗诊断、工业质检领域已进入规模化落地阶段
  • 通过数据蒸馏打破语音情感识别的资源壁垒