当前位置: 首页 > news >正文

AI心情日记后端迁移K8s部署全流程

一、项目背景与目标

今天想将本地以java -jar运行的Spring Boot应用(AI心情日记后端)迁移至Kubernetes集群,实现容器化部署和健康管理,顺便再次回顾一下k8s的操作细节。
因为我引入了springAI组件,这个组件需要springboot版本在3.2以上,jdk要17 以上,在部署的过程中遇到了一些问题。


二、引入健康检查模块(Spring Boot Actuator)

1. 添加Maven依赖(pom.xml
<!-- 引入Spring Boot Actuator实现健康检查 -->
<dependency>
    <groupId>org.springframework.boot</groupId>
    <artifactId>spring-boot-starter-actuator</artifactId>
</dependency>

三、容器化:Dockerfile配置

# 使用轻量级 OpenJDK 19
FROM openjdk:19

# 设置工作目录(避免容器内路径冲突)
WORKDIR /app

# 复制编译好的 JAR 文件到容器
COPY target/ai-0.0.1-SNAPSHOT.jar app.jar


# 启动命令(可添加 JVM 参数优化性能)
ENTRYPOINT ["java", "-jar", "app.jar"]

四、Kubernetes资源配置

1. Deployment配置(deployment.yaml
# 指定 API 版本(不同资源类型对应不同 API 版本)
apiVersion: apps/v1
# 定义资源类型为 Deployment(副本控制器)
kind: Deployment

# 元数据部分(定义资源标识)
metadata:
  # Deployment 对象名称(集群内唯一)
  name: ai-app
  # 标签系统(可用于其他资源关联筛选)
  labels:
    app: ai-app

# 部署规格(核心配置部分)
spec:
  # 期望的 Pod 副本数量(此处设置为 1,生产环境建议至少 2)
  replicas: 1

  # 标签选择器(告诉 Deployment 如何找到要管理的 Pod)
  selector:
    matchLabels:
      # 必须与 template.metadata.labels 完全匹配
      app: ai-app

  # Pod 模板(定义具体 Pod 的配置)
  template:
    metadata:
      labels:
        # Pod 标签(必须与 selector.matchLabels 一致)
        app: ai-app

    # Pod 规格(定义容器细节)
    spec:
      containers:
        - name: ai-container  # 容器名称(同一 Pod 内多个容器需唯一)
          # 镜像地址(需与 docker build 时设置的名称一致)
          image: xiajing/ai-service:v1.1

          # 容器端口声明(仅文档作用,实际暴露需配合 Service)
          ports:
            - containerPort: 8100  # 此处存在错误,应与应用实际端口一致(见下方说明)

          # 资源配额管理(关键配置)
          resources:
            # 请求资源(调度依据,节点必须满足才能运行)
            requests:
              cpu: "1"    # 0.5 核(500m,即 500 毫核)
              memory: "1Gi"  # 512MB(二进制单位,1Mi=1024^2 bytes)
            # 资源上限(防止容器耗尽节点资源)
            limits:
              cpu: "2"      # 最多使用 1 核
              memory: "2Gi" # 最多使用 1GB(二进制单位)

          # 存活探针(失败则重启容器)
          livenessProbe:
            httpGet:  # 使用 HTTP GET 请求检测
              path: /actuator/health/liveness  # 健康检查路径(需应用实现该接口)
              port: 8100  # 必须与 containerPort 一致,应为 8100
            initialDelaySeconds: 30  # 容器启动后 30 秒开始探测
            periodSeconds: 10        # 每 10 秒检测一次
            timeoutSeconds: 5        # 超时时间(默认 1 秒)
            failureThreshold: 3      # 连续失败 3 次标记为不健康

          # 就绪探针(通过后才接收流量)
          readinessProbe:
            httpGet:
              path: /actuator/health/readiness
              port: 8100  # 同上错误,应改为 8100
2. Service配置(service.yaml
# 指定 API 版本(Service 使用 core/v1)
apiVersion: v1
# 定义资源类型为 Service
kind: Service

# 元数据部分
metadata:
  # Service 名称(集群内唯一标识)
  name: ai-service

# Service 规格(核心配置)
spec:
  # 标签选择器(选择要代理的 Pod)
  selector:
    # 必须与 Deployment 中 Pod 的标签完全匹配
    app: ai-app  # 需与 Deployment 的标签一致(原配置中是 app: ai-app)

  # 端口映射规则
  ports:
    - protocol: TCP      # 协议类型(支持 TCP/UDP/SCTP)
      port: 8101           # Service 对外暴露的端口(集群内访问用)
      targetPort: 8100   # Pod 容器的实际端口(必须与容器端口一致)
      nodePort: 31000
  # Service 类型(决定如何暴露服务)
  type: NodePort         # 可选值:ClusterIP(默认)、NodePort、LoadBalancer

五、执行部署脚本

# 1. 构建并推送镜像
docker build -t your-registry/diary-backend:1.0 .  # 构建镜像
docker push your-registry/diary-backend:1.0        # 推送到镜像仓库

# 2. 部署到Kubernetes
kubectl apply -f deployment.yaml  # 创建Deployment
kubectl apply -f service.yaml      # 创建Service

# 3. 验证部署状态
kubectl get pods -o wide          # 查看Pod状态和所在节点
kubectl get svc diary-service    # 获取Service的NodePort端口

六、验证服务状态

# 1. 检查Pod是否就绪
kubectl get pods -l app=diary-backend
# 预期输出:READY 1/1,STATUS Running

# 2. 查看健康检查日志
kubectl logs <pod-name> | grep 'actuator/health'
# 预期输出:200 OK

# 3. 访问服务接口(通过NodePort)
curl http://<节点IP>:31000/api/diary
# 预期输出:JSON格式的日记数据

七、问题与解决:JDK版本升级

1. 错误现象

部署后Pod状态为CrashLoopBackOff,日志报错:

Caused by: java.lang.NullPointerException: 
  Cannot invoke "jdk.internal.platform.CgroupInfo.getMountPoint()"
2. 原因分析
  • JDK 17的局限性jdk.internal.platform模块在部分镜像(如slim)中缺失。
  • 容器环境兼容性:Kubernetes Cgroup v2与JDK 17的兼容性问题。
3. 解决方案
  • 升级JDK到19:使用完整镜像openjdk:19-jdk
  • 更新Dockerfile
    FROM openjdk:19   # 运行阶段JDK 19
    
  • 验证修复
    kubectl rollout restart deployment/diary-backend  # 触发重建Pod
    kubectl get pods -w  # 观察新Pod状态
    

八、总结

通过本流程,我已实现:

  1. 健康检查集成:通过Actuator实现存活/就绪探针。
  2. 容器化优化:多阶段构建减少镜像体积至200MB以下。
  3. K8s生产级配置:资源限制、滚动更新策略、服务暴露。
  4. 版本问题解决:升级JDK 19彻底修复Cgroup兼容性问题。

最终成果:AI心情日记后端稳定运行于Kubernetes集群,可通过http://<节点IP>:31000访问,后面如果有流量增加可以自动弹性伸缩。

相关文章:

  • Linux之系统文件目录理解
  • 紧急救援!MySQL数据库误删后的3种恢复方案
  • 一种改进的Estimation-of-Distribution差分进化算法
  • 19 | 实现身份认证功能
  • 实现客户端的网络不影响主线程且随时与服务器通信
  • (每日一题) 力扣 2418. 按身高排序
  • Java多线程与高并发专题——阻塞和非阻塞队列的并发安全原理是什么?
  • H.264语法结构分析之frame_cropping_flag
  • PySide(PyQT)的mouseMoveEvent()和hoverMoveEvent()的区别
  • 关于Flutter中两种Widget的生命周期详解
  • JQuery
  • 泛微ecode的页面开发发送请求参数携带集合
  • 嵌入式八股C语言---面向对象篇
  • Linux多进程学习
  • 【JavaWeb学习Day25】
  • Java 大视界 -- Java 大数据在智能安防视频摘要与检索技术中的应用(128)
  • 1.8 双指针专题:四数之和
  • 销售易CRM:赋能企业销售与客户管理的数字化升级
  • 小凯的疑惑(数论 )
  • LeetCode-122. 买卖股票的最佳时机 II
  • 雅典卫城上空现“巨鞋”形状无人机群,希腊下令彻查
  • 六省会共建交通枢纽集群,中部六省离经济“第五极”有多远?
  • 国家统计局:2024年城镇单位就业人员工资平稳增长
  • 美官方将使用华为芯片视作违反美出口管制行为,外交部回应
  • 一种声音·阿甘本|即将到来的中世纪;“新”与“旧”……
  • 国家统计局向多省份反馈统计督察意见