Kubernetes 常见问题全解析
Kubernetes 常见问题全解析
引言:Kubernetes 问题排查心法
在深入具体问题前,请记住两个核心命令和排查思路:
- kubectl describe
 你的第一道防线。用于查看资源(如 Pod、Node、Service)的详细状态和事件(Events),这里通常包含了错误原因。
- kubectl logs
 你的第二道防线。用于查看 Pod 内容器的日志,直接获取应用输出的错误信息。
- 排查思路
 遵循从外到内,从大到小的原则:Node → Pod → Container → Application。
一、部署与配置问题
1. ImagePullBackOff / ErrImagePull
现象: Pod 状态为 ImagePullBackOff 或 ErrImagePull。
 原因:
- 镜像名称或标签错误
- 私有仓库认证失败(缺少 imagePullSecrets)
- 网络问题,节点无法访问镜像仓库
- 镜像架构不匹配
解决方案:
- 检查镜像地址:
kubectl describe pod <pod-name>- 配置私有仓库密钥:
kubectl create secret docker-registry my-registry-key \--docker-server=<registry> \--docker-username=<user> \--docker-password=<pass> \--docker-email=<email>spec:imagePullSecrets:- name: my-registry-key
- 节点上尝试手动 docker pull 或 crictl pull。
2. CrashLoopBackOff
现象: Pod 启动后很快崩溃,状态不断切换 CrashLoopBackOff ↔ Error。
 原因:容器内应用启动失败。
