当前位置：首页 > news >正文

Kubernetes Pod健康检查全解析：从Liveness到滚动更新，掌握容器健康管理的核心技巧

news 2025/11/4 6:04:09

#作者：程宏斌

文章目录

一、Pod的liveness和readiness探针
- Probe支持以下三种检查方法：
- - 1. exec-命令
  - 2. TCPSocket
  - 3. HTTPGet
- 探针探测的结果有以下三者之一：
- - 1. LivenessProbe（活跃度）
  - 2. Readiness（敏感探测、就绪性探测）
  - 3. 总结liveness和readiness探测
二、健康检测的应用
- 1. 在scale(扩容/缩容) 中的应用。
- 2. 在更新过程中的使用

一、Pod的liveness和readiness探针

Kubelet使用liveness probe（存活探针）来确定何时重启容器。例如，当应用程序处于运行状态但无法做进一步操作，liveness探针将捕获到deadlock，重启处于该状态下的容器，使应用程序在存在bug的情况下依然能够继续运行下去
Kubelet使用readiness probe（就绪探针）来确定容器是否已经就绪可以接受流量。只有当Pod中的容器都处于就绪状态时kubelet才会认定该Pod处于就绪状态。该信号的作用是控制哪些Pod应该作为service的后端。如果Pod处于非就绪状态，那么它们将会被从service的load balancer中移除。

Probe支持以下三种检查方法：

1. exec-命令

在用户容器内执行一次命令，如果命令执行的退出码为0，则认为应用程序正常运行，其他任务应用程序运行不正常。

livenessProbe:
  exec:
    command:
    - cat
    - /home/laizy/test/hostpath/healthy

2. TCPSocket

将会尝试打开一个用户容器的Socket连接（就是IP地址：端口）。如果能够建立这条连接，则认为应用程序正常运行，否则认为应用程序运行不正常。

livenessProbe:
tcpSocket:
   port: 8080

3. HTTPGet

调用容器内Web应用的web hook，如果返回的HTTP状态码在200和399之间，则认为应用程序正常运行，否则认为应用程序运行不正常。每进行一次HTTP健康检查都会访问一次指定的URL。

httpGet: #通过httpget检查健康，返回200-399之间，则认为容器正常
  path: / #URI地址
  port: 80 #端口号
  #host: 127.0.0.1 #主机地址
  scheme: HTTP #支持的协议，http或者https
httpHeaders：’’ #自定义请求的header

参数说明
initialDelaySeconds：容器启动后第一次执行探测是需要等待多少秒。
periodSeconds：执行探测的频率。默认是10秒，最小1秒。
timeoutSeconds：探测超时时间。默认1秒，最小1秒。
successThreshold：探测失败后，最少连续探测成功多少次才被认定为成功。默认是1。对于liveness必须是1。最小值是1。

探针探测的结果有以下三者之一：

Success：Container通过了检查。
Failure：Container未通过检查。
Unknown：未能执行检查，因此不采取任何措施。

1. LivenessProbe（活跃度）

（1）编写一个livenss的yaml文件

[root@node02 ~]# vim livenss.yaml
kind: Pod
apiVersion: v1
metadata:
  name: liveness
  labels:
    test: liveness
spec:
  restartPolicy: OnFailure
  containers:
  - name: liveness
    image: busybox
    args:
    - /bin/sh
    - -c
    - touch /tmp/test; sleep 60; rm -rf /tmp/test; sleep 300
    livenessProbe:              #存活探测
      exec:                     #通过执行命令来检查服务是否正常
        command:                #命令模式
        - cat
        - /tmp/test
      initialDelaySeconds: 10    #pod运行10秒后开始探测
      periodSeconds: 5           #检查的频率，每5秒探测一次

该配置文件给Pod配置了一个容器。periodSeconds 规定kubelet要每隔5秒执行一次liveness probe。initialDelaySeconds 告诉kubelet在第一次执行probe之前要的等待10秒钟。探针检测命令是在容器中执行 cat /tmp/healthy 命令。如果命令执行成功，将返回0，kubelet就会认为该容器是活着的并且很健康。如果返回非0值，kubelet就会杀掉这个容器并重启它。

（2）运行

[root@master ~]# kubectl apply -f liveness.yaml

（3）查看

[root@master ~]# kubectl get pod -w

Liveness活跃度探测，根据探测某个文件是否存在，来确定某个服务是否正常运行，如果存在则正常，负责，它会根据你设置的Pod的重启策略操作Pod。

2. Readiness（敏感探测、就绪性探测）

ReadinessProbe探针的使用场景livenessProbe稍有不同，有的时候应用程序可能暂时无法接受请求，比如Pod已经Running了，但是容器内应用程序尚未启动成功，在这种情况下，如果没有ReadinessProbe，则Kubernetes认为它可以处理请求了，然而此时，我们知道程序还没启动成功是不能接收用户请求的，所以不希望kubernetes把请求调度给它，则使用ReadinessProbe探针。

ReadinessProbe和livenessProbe可以使用相同探测方式，只是对Pod的处置方式不同，ReadinessProbe是将Pod IP:Port从对应的EndPoint列表中删除，而livenessProbe则Kill容器并根据Pod的重启策略来决定作出对应的措施。

ReadinessProbe探针探测容器是否已准备就绪，如果未准备就绪则kubernetes不会将流量转发给此Pod。

ReadinessProbe探针与livenessProbe一样也支持exec、httpGet、TCP的探测方式，配置方式相同，只不过是将livenessProbe字段修改为ReadinessProbe。

（1）编写一个readiness的yaml文件

[root@master ~]# vim readiness.yaml 
kind: Pod
apiVersion: v1
metadata:
  name: readiness
  labels:
    test: readiness
spec:
  restartPolicy: Never
  containers:
  - name: readiness
    image: busybox
    args:
    - /bin/sh
    - -c
    - touch /tmp/test; sleep 60; rm -rf /tmp/test; sleep 300
    readinessProbe:
      exec:
        command:
        - cat
        - /tmp/test
      initialDelaySeconds: 10
      periodSeconds: 5

（2）运行

[root@master ~]# kubectl apply -f readiness.yaml

（3）查看

[root@master ~]# kubectl get pod -w

在这里插入图片描述

3. 总结liveness和readiness探测

（1）liveness和readiness是两种健康检查机制，k8s将两种探测采取相同的默认行为，即通过判断容器启动进程的返回值是否为零，来判断探测是否成功。
（2）两种探测配置方法完全一样，不同之处在于探测失败后的行为。
liveness探测是根据重启策略操作容器，大多数是重启容器。
readiness则是将容器设置为不可用，不接收Service转发的请求。
（3）两种探测方法可建议独立存在，也可以同时存在。用livensess判断是否需要重启，实现自愈；用readiness判断容器是否已经准备好对外提供服务。

二、健康检测的应用

1. 在scale(扩容/缩容) 中的应用。

（1）编写一个readiness的yaml文件

[root@master ~]# vim hcscal.yaml
kind: Deployment
apiVersion: extensions/v1beta1
metadata:
  name: web
spec:
  replicas: 3
  template: 
    metadata:
      labels:
        run: web
    spec:
      containers:
      - name: web
        image: httpd
        ports:
        - containerPort: 80
        readinessProbe:
          httpGet:
            scheme: HTTP   #探测的协议
            path: /healthy  #访问的目录
            port: 80
          initialDelaySeconds: 10
          periodSeconds: 5

---
kind: Service
apiVersion: v1
metadata:
  name: web-svc
spec:
  type: NodePort
  selector:
    run: web
  ports:
  - protocol: TCP
    port: 90
    targetPort: 80
    nodePort: 30321

在配置文件中，使用httpd镜像，创建出一个Pod，其中periodSeconds字段指定kubelet每5秒执行一次探测，initialDelaySeconds字段告诉kubelet延迟等待10秒，探测方式为向容器中运行的服务发送HTTP GET请求，请求8080端口下的/healthz, 任何大于或等于200且小于400的代码表示成功。任何其他代码表示失败。

httpGet探测方式有如下可选的控制字段

host：要连接的主机名，默认为Pod IP，可以在http request head中设置host头部。
scheme: 用于连接host的协议，默认为HTTP。
path：http服务器上的访问URI。
httpHeaders：自定义HTTP请求headers，HTTP允许重复headers。
port：容器上要访问端口号或名称。

（2）运行

[root@master ~]# kubectl apply -f readiness.yaml

（3）查看

[root@master ~]# kubectl get pod -w

在这里插入图片描述

[root@master ~]# kubectl get pod -o wide

在这里插入图片描述

[root@master ~]# kubectl get service -o wide

在这里插入图片描述
（4）访问

[root@master ~]# curl  10.244.1.21/healthy

在这里插入图片描述
（5）pod在指定目录创建一个文件

[root@master ~]# kubectl exec web-69d659f974-7s9bc touch /usr/local/apache2/htdocs/healthy

（6）查看

[root@master ~]# kubectl get pod -w

在这里插入图片描述

2. 在更新过程中的使用

（1）编写一个readiness的yaml文件

[root@master ~]# vim app.v1.yaml
apiVersion: extensions/v1beta1
kind: Deployment
metadata:
  name: app
spec:
  replicas: 10
  template:
    metadata:
      labels:
        run: app
    spec:
      containers:
      - name: app
        image: busybox
        args:
        - /bin/sh
        - -c
        - sleep 10; touch /tmp/healthy; sleep 3000
        readinessProbe:
          exec:
            command:
            - cat
            - /tmp/healthy
          initialDelaySeconds: 10
          periodSeconds: 5

（2）运行并记录版本信息

[root@master ~]# kubectl apply -f readiness.yaml --record

查看

[root@master ~]# kubectl rollout history deployment app

在这里插入图片描述
（3）查看

[root@master ~]# kubectl get pod -w

在这里插入图片描述

查看全文

http://www.dtcms.com/a/26338.html

DeepSeek是什么？两种模型的对比？

系统设计之分布式

C++编程语言：抽象机制：模板和层级结构(Bjarne Stroustrup)

宏块划分的原理

LeetCode1299

自动创建spring boot应用（eclipse版本）

DeepSeek 入门指南

【解决方法】vite-plugin-svg-icons使用中出现问题[vite] Cannot find package ‘fast-glob‘

网络爬虫学习：借助DeepSeek完善爬虫软件，实现模拟鼠标右键点击，将链接另存为本地文件

BiRefNet C++ TensorRT （二分类图像分割）

MySQL数据库入门到大蛇尚硅谷宋红康老师笔记高级篇 part 1

[原创](Modern C++)现代C++的关键性概念: 妙用std::reference_wrapper, 让std::list容器具有随机访问功能.

Zookeeper（54）如何使用Zookeeper的命令行工具？

寒假学习总结

如何解决服务器端口被攻击：全面防护与快速响应

侯捷 C++ 课程学习笔记：设计模式在面向对象开发中的应用

Soft Actor-Critic (SAC)算法

嵌入式人工智能应用-第四章逻辑回归 8

unity学习48：动态障碍物 Obstacle 对 NavMesh的影响

LearnOpenGL——高级OpenGL（下）

企业级RAG开源项目分享：Quivr、MaxKB、Dify、FastGPT、RagFlow

4.4 使用Datasets.map方法处理数据集：从基础到企业级优化

Spring IoC DI：控制反转与依赖注入

IGT_GPU_TOOL系列之CRC（一）：test_grab_crc

SQLMesh 系列教程6- 详解 Python 模型

2025/2/19机试准备

STM32 HAL库I2C函数使用详解：以MPU6050传感器为例

配置终端代理

【架构】分层架构 (Layered Architecture)

OpenResty

文章目录

一、Pod的liveness和readiness探针

Probe支持以下三种检查方法：

1. exec-命令

2. TCPSocket

3. HTTPGet

探针探测的结果有以下三者之一：

1. LivenessProbe（活跃度）

2. Readiness（敏感探测、就绪性探测）

3. 总结liveness和readiness探测

二、健康检测的应用

1. 在scale(扩容/缩容) 中的应用。

2. 在更新过程中的使用

相关文章：