Linux服务器崩溃急救指南:快速诊断与恢复
一、 立即响应与初步诊断
- 确认崩溃现象:
- 服务器完全无响应(网络、SSH、控制台)?
- 部分服务不可用?
- 服务器响应极其缓慢?
- 物理访问检查 (如果可行):
- 观察服务器状态指示灯(电源、硬盘活动、网络)。
- 检查显示器输出 (KVM 或本地):是否卡在内核恐慌 (
Kernel panic)、Out of Memory(OOM) 信息、硬件错误信息等。 - 尝试通过服务器管理口 (IPMI, iDRAC, iLO) 查看状态和日志。
- 网络连通性基础测试:
ping $SERVER_IP - 尝试通过控制台访问:
- 使用
Alt + SysRq + [KEY](需内核支持并启用) 尝试触发安全重启或获取信息。 - 通过管理口打开虚拟控制台。
- 使用
二、 系统日志分析 (关键步骤)
- 定位日志文件:
- 最后一次启动的日志:
$ journalctl -b -1(Systemd) 或/var/log/boot.log。 - 系统日志:
$ journalctl(Systemd) 或/var/log/syslog,/var/log/messages。 - 内核日志:
$ dmesg -
- 最后一次启动的日志:
