当前位置: 代码网 > it编程>编程语言>Java > Java 部署滚动更新的方法(K8s RollingUpdate 策略)

Java 部署滚动更新的方法(K8s RollingUpdate 策略)

2026年03月05日 Java 我要评论
在现代云原生应用开发中,持续交付和零停机部署已成为企业级 java 应用的标配。而 kubernetes(简称 k8s)作为事实上的容器编排平台,其 rollingupdate(滚动更新) 策略为实现

在现代云原生应用开发中,持续交付和零停机部署已成为企业级 java 应用的标配。而 kubernetes(简称 k8s)作为事实上的容器编排平台,其 rollingupdate(滚动更新) 策略为实现平滑、安全、无感知的应用升级提供了强大支持。本文将深入探讨如何在 kubernetes 中对 java 应用实施滚动更新,涵盖原理、配置、最佳实践、故障处理以及完整的代码与部署示例。

无论你是刚接触 k8s 的 java 开发者,还是已有一定经验但希望优化部署流程的 devops 工程师,本文都将为你提供实用、可落地的指导。让我们从基础开始,逐步构建一个健壮、可维护的滚动更新体系 🚀。

什么是滚动更新(rolling update)?

滚动更新是一种渐进式部署新版本应用的策略。它通过逐个替换旧 pod的方式,确保在整个更新过程中服务始终可用,从而实现零停机(zero downtime) 的目标。

在 kubernetes 中,当你更新一个 deployment 的镜像版本或配置时,如果策略设置为 rollingupdate(默认值),k8s 会自动执行以下操作:

  1. 启动一个或多个新版本的 pod;
  2. 等待新 pod 就绪(通过就绪探针 ready probe 判断);
  3. 将流量从旧 pod 逐步切换到新 pod;
  4. 删除一个或多个旧 pod;
  5. 重复上述过程,直到所有旧 pod 被替换。

这种“边下边上”的方式,避免了传统“蓝绿部署”或“全量替换”可能带来的服务中断风险。

💡 小知识:kubernetes 的滚动更新是基于 replicaset 实现的。每次更新 deployment 时,k8s 会创建一个新的 replicaset,并逐步缩容旧 replicaset、扩容新 replicaset。

为什么 java 应用特别需要滚动更新?

java 应用通常具有以下特点,使其对滚动更新有更高需求:

  • 启动时间较长:jvm 预热、spring boot 初始化等过程可能需要数秒甚至数十秒;
  • 内存占用高:频繁重启可能导致资源竞争;
  • 有状态中间件依赖:如数据库连接池、缓存客户端等,需优雅关闭;
  • 高可用要求:企业级系统通常要求 99.9% 以上的可用性。

若采用一次性删除所有旧实例再启动新实例的方式,用户将经历明显的请求失败或超时。而滚动更新通过控制并发替换数量,确保始终有足够健康的实例处理请求,极大提升了用户体验和系统稳定性 ✅。

kubernetes 滚动更新的核心机制

kubernetes 的滚动更新由两个关键参数控制:

  • maxunavailable:更新过程中允许不可用的 pod 最大数量(相对于期望副本数);
  • maxsurge:更新过程中允许超出期望副本数的最大 pod 数量

这两个参数共同决定了更新的速度与安全性。

默认值

对于一个 replicas: 3 的 deployment,其默认滚动更新策略如下:

strategy:
  type: rollingupdate
  rollingupdate:
    maxunavailable: 25%
    maxsurge: 25%

这意味着:

  • 最多允许 1 个 pod 不可用(3 × 25% ≈ 0.75 → 向上取整为 1);
  • 最多允许临时增加 1 个 pod(3 × 25% ≈ 0.75 → 向上取整为 1)。

因此,更新过程可能如下:

  1. 创建 1 个新 pod(总数变为 4);
  2. 等待新 pod 就绪;
  3. 删除 1 个旧 pod(总数回到 3);
  4. 重复直到全部替换。

参数详解

参数类型说明
maxunavailableint 或百分比更新期间可处于“未就绪”状态的 pod 数量上限。设为 0 可实现完全无损更新(但需配合 maxsurge > 0)。
maxsurgeint 或百分比允许超过 replicas 设定值的额外 pod 数量。用于提前启动新实例,加快更新速度。

⚠️ 注意:maxunavailablemaxsurge 不能同时为 0,否则更新将无法进行。

构建一个支持滚动更新的 java 应用

为了演示滚动更新,我们先构建一个简单的 spring boot 应用,包含健康检查端点。

1. 创建 spring boot 项目

使用 spring initializr 创建一个 web 项目,添加 spring webspring boot actuator 依赖。

2. 编写主类

// src/main/java/com/example/rollingupdate/demoapplication.java
package com.example.rollingupdate;
import org.springframework.boot.springapplication;
import org.springframework.boot.autoconfigure.springbootapplication;
@springbootapplication
public class demoapplication {
    public static void main(string[] args) {
        springapplication.run(demoapplication.class, args);
    }
}

3. 添加控制器

// src/main/java/com/example/rollingupdate/hellocontroller.java
package com.example.rollingupdate;
import org.springframework.web.bind.annotation.getmapping;
import org.springframework.web.bind.annotation.restcontroller;
@restcontroller
public class hellocontroller {
    @getmapping("/hello")
    public string hello() {
        return "hello from java app v1! 🌟";
    }
    // 模拟版本信息,便于观察更新效果
    @getmapping("/version")
    public string version() {
        return "v1.0.0";
    }
}

4. 配置 actuator 健康端点

application.yml 中启用健康检查端点:

# src/main/resources/application.yml
management:
  endpoints:
    web:
      exposure:
        include: health,info
  endpoint:
    health:
      show-details: always

actuator 默认提供 /actuator/health 端点,返回 {"status":"up"} 表示应用健康。

5. 构建 docker 镜像

编写 dockerfile

# dockerfile
from eclipse-temurin:17-jre-alpine
workdir /app
copy target/*.jar app.jar
expose 8080
entrypoint ["java", "-jar", "app.jar"]

构建并打标签(假设你的 docker hub 用户名为 yourname):

./mvnw clean package -dskiptests
docker build -t yourname/java-rolling-demo:v1 .
docker push yourname/java-rolling-demo:v1

🔗 你可以参考 docker 官方文档 了解如何构建镜像。

编写 kubernetes deployment 配置

接下来,我们将这个 java 应用部署到 kubernetes,并配置滚动更新策略。

deployment.yaml

apiversion: apps/v1
kind: deployment
metadata:
  name: java-rolling-demo
spec:
  replicas: 3
  strategy:
    type: rollingupdate
    rollingupdate:
      maxunavailable: 1
      maxsurge: 1
  selector:
    matchlabels:
      app: java-rolling-demo
  template:
    metadata:
      labels:
        app: java-rolling-demo
    spec:
      containers:
      - name: app
        image: yourname/java-rolling-demo:v1
        ports:
        - containerport: 8080
        livenessprobe:
          httpget:
            path: /actuator/health
            port: 8080
          initialdelayseconds: 30
          periodseconds: 10
        readinessprobe:
          httpget:
            path: /actuator/health
            port: 8080
          initialdelayseconds: 10
          periodseconds: 5
        resources:
          requests:
            memory: "256mi"
            cpu: "100m"
          limits:
            memory: "512mi"
            cpu: "200m"
---
apiversion: v1
kind: service
metadata:
  name: java-rolling-demo-svc
spec:
  selector:
    app: java-rolling-demo
  ports:
    - protocol: tcp
      port: 80
      targetport: 8080
  type: clusterip

关键配置说明

  • readinessprobe:决定 pod 是否准备好接收流量。只有当探针成功,service 才会将请求转发给该 pod。这对滚动更新至关重要——新 pod 必须完全就绪后才能加入服务。
  • livenessprobe:用于判断应用是否存活。若失败,k8s 会重启容器。
  • resources:限制资源使用,避免单个 pod 占用过多资源影响其他实例。
  • maxunavailable: 1:最多允许 1 个 pod 不可用(3 个副本时,至少 2 个在线)。
  • maxsurge: 1:允许临时多启动 1 个 pod,加快更新速度。

📌 重要readinessprobe 是滚动更新平滑性的核心!务必确保其路径能真实反映应用就绪状态。

部署并验证初始状态

应用上述配置:

kubectl apply -f deployment.yaml

检查 pod 状态:

kubectl get pods -l app=java-rolling-demo

输出应类似:

name                                 ready   status    restarts   age
java-rolling-demo-7d5b8c9f45-abc12   1/1     running   0          2m
java-rolling-demo-7d5b8c9f45-def34   1/1     running   0          2m
java-rolling-demo-7d5b8c9f45-ghi56   1/1     running   0          2m

测试服务:

# 获取 service ip(或使用 nodeport/ingress)
kubectl get svc java-rolling-demo-svc
# 使用 curl 测试(假设已暴露到外部)
curl http://<service-ip>/version
# 返回: v1.0.0

执行滚动更新:从 v1 到 v2

现在,我们准备发布新版本 v2。

1. 修改 java 应用代码

更新 hellocontroller.java

@getmapping("/version")
public string version() {
    return "v2.0.0"; // 改为 v2
}

并修改欢迎语:

@getmapping("/hello")
public string hello() {
    return "hello from java app v2! 🚀";
}

2. 构建并推送 v2 镜像

./mvnw clean package -dskiptests
docker build -t yourname/java-rolling-demo:v2 .
docker push yourname/java-rolling-demo:v2

3. 触发滚动更新

有两种方式:

方式一:直接修改 deployment yaml

image 字段改为 yourname/java-rolling-demo:v2,然后执行:

kubectl apply -f deployment.yaml

方式二:使用kubectl set image(推荐)

kubectl set image deployment/java-rolling-demo app=yourname/java-rolling-demo:v2

✅ 这种方式无需修改文件,适合 ci/cd 自动化。

4. 监控更新过程

查看滚动更新状态:

kubectl rollout status deployment/java-rolling-demo

输出示例:

waiting for deployment "java-rolling-demo" rollout to finish: 1 out of 3 new replicas have been updated...
waiting for deployment "java-rolling-demo" rollout to finish: 2 out of 3 new replicas have been updated...
deployment "java-rolling-demo" successfully rolled out

同时,观察 pod 变化:

kubectl get pods -w -l app=java-rolling-demo

你将看到旧 pod 逐步被终止,新 pod 逐步启动:

name                                 ready   status              restarts   age
java-rolling-demo-7d5b8c9f45-abc12   1/1     running             0          5m
java-rolling-demo-7d5b8c9f45-def34   1/1     running             0          5m
java-rolling-demo-7d5b8c9f45-ghi56   1/1     running             0          5m
java-rolling-demo-6b8d9f7c54-jkl78   0/1     containercreating   0          1s
java-rolling-demo-6b8d9f7c54-jkl78   1/1     running             0          10s
java-rolling-demo-7d5b8c9f45-abc12   1/1     terminating         0          5m30s
...

5. 验证新版本

多次调用 /version 接口:

for i in {1..10}; do curl -s http://<service-ip>/version; echo; done

初期可能返回 v1.0.0v2.0.0 混合结果,随着更新完成,最终全部返回 v2.0.0

这正是滚动更新的典型特征:流量逐步切换,用户无感知

可视化滚动更新过程

下面是一个 mermaid 图表,展示滚动更新中 pod 状态的变化:

💡 图中显示:新 pod 在旧 pod 终止前已启动并就绪,确保服务连续性。

滚动更新中的关键保障:探针(probes)

前面提到,readinessprobe 是滚动更新平滑的关键。让我们深入理解其作用。

readiness probe(就绪探针)

  • 作用:告诉 k8s “我准备好接收流量了吗?”
  • 触发时机:pod 启动后周期性调用。
  • 行为:若失败,pod 不会被加入 service 的 endpoints,即不会收到任何请求
  • java 应用建议
    • 初始延迟(initialdelayseconds)应大于应用启动时间(如 spring boot 通常 10-30 秒);
    • 路径应返回真实业务就绪状态(如数据库连接成功、缓存初始化完成等)。

liveness probe(存活探针)

  • 作用:告诉 k8s “我还活着吗?”
  • 行为:若连续失败,k8s 会重启容器。
  • 注意:不要将复杂逻辑放入 liveness probe,否则可能导致误杀。

示例:增强健康检查

你可以自定义健康指示器,确保只有在所有依赖就绪后才返回 up:

@component
public class databasehealthindicator implements healthindicator {
    @override
    public health health() {
        // 检查数据库连接
        if (isdatabaseconnected()) {
            return health.up().withdetail("database", "available").build();
        }
        return health.down().withdetail("database", "unavailable").build();
    }
}

这样,即使 spring boot 启动完成,若数据库未连通,/actuator/health 仍返回 down,pod 不会接收流量,避免错误请求。

🔗 更多关于 spring boot 健康检查的信息,可参考 spring boot actuator 文档

处理滚动更新失败:回滚(rollback)

尽管我们做了充分准备,但更新仍可能失败(如新版本有 bug、配置错误等)。kubernetes 提供了便捷的回滚机制。

查看更新历史

kubectl rollout history deployment/java-rolling-demo

输出:

revision  change-cause
1         <none>
2         kubectl set image deployment/java-rolling-demo app=yourname/java-rolling-demo:v2

回滚到上一版本

kubectl rollout undo deployment/java-rolling-demo

k8s 会自动将镜像切回 v1,并执行反向滚动更新。

回滚到指定版本

kubectl rollout undo deployment/java-rolling-demo --to-revision=1

自动回滚(高级)

kubernetes 本身不支持“自动回滚”,但可通过以下方式实现:

  • 结合监控告警:如 prometheus + alertmanager 检测到错误率飙升,触发 webhook 执行 kubectl rollout undo
  • 使用 argo rollouts:这是一个 k8s 扩展,支持金丝雀发布、自动回滚等高级功能。

🔗 argo rollouts 官网 提供了更强大的渐进式交付能力。

优化滚动更新体验的最佳实践

1. 设置合理的探针参数

readinessprobe:
  httpget:
    path: /actuator/health
    port: 8080
  initialdelayseconds: 20   # 根据应用启动时间调整
  periodseconds: 5
  timeoutseconds: 3
  successthreshold: 1
  failurethreshold: 3

2. 控制更新速度

  • 若系统敏感,可设置 maxunavailable: 0maxsurge: 1,确保始终有全部副本在线;
  • 若追求速度,可增大 maxsurge(如 50%),但需注意资源压力。

3. 使用 prestop hook 实现优雅关闭

在 java 应用终止前,执行清理操作(如关闭连接池、拒绝新请求):

containers:
- name: app
  image: yourname/java-rolling-demo:v2
  lifecycle:
    prestop:
      exec:
        command: ["/bin/sh", "-c", "sleep 15"]

同时,在 spring boot 中启用优雅关闭:

# application.yml
server:
  shutdown: graceful
spring:
  lifecycle:
    timeout-per-shutdown-phase: 30s

这样,当 pod 被删除时:

  1. k8s 先从 service endpoints 中移除该 pod(不再接收新请求);
  2. 执行 prestop hook(等待 15 秒,让现有请求完成);
  3. 发送 sigterm 信号给 java 进程;
  4. spring boot 优雅关闭;
  5. 若超时未退出,发送 sigkill。

🌐 更多关于优雅关闭的内容,可参考 kubernetes 官方文档 - termination of pods

4. 监控滚动更新指标

通过 prometheus 监控以下指标:

  • kube_deployment_status_replicas_updated:已更新的副本数;
  • kube_pod_status_ready:pod 就绪状态;
  • 应用层指标:错误率、延迟、吞吐量。

一旦异常,立即告警或自动回滚。

滚动更新 vs 其他部署策略

kubernetes 还支持其他部署策略,适用于不同场景:

策略特点适用场景
rollingupdate逐步替换,零停机大多数生产环境
recreate先删所有旧 pod,再建新 pod可接受短暂停机,或有状态应用需完全重置
blue/greenk8s 原生不支持,需 service 切换需要快速回滚、全量验证
canaryk8s 原生不支持,需 ingress 或 service mesh渐进式发布,小流量验证

💡 对于 java 应用,rollingupdate 是最常用且最安全的选择

常见问题与排查

q1: 更新卡住了,怎么办?

  • 检查新 pod 是否就绪:kubectl describe pod <new-pod>
  • 查看日志:kubectl logs <new-pod>
  • 检查 readinessprobe 是否失败;
  • 确认镜像是否拉取成功(网络、权限问题)。

q2: 用户偶尔收到 502 错误?

  • 可能是旧 pod 被终止时仍有请求在处理;
  • 解决方案:配置 prestop hook + 优雅关闭;
  • 确保 service 的 sessionaffinity 未开启(除非必要)。

q3: 如何暂停/恢复滚动更新?

# 暂停
kubectl rollout pause deployment/java-rolling-demo
# 恢复
kubectl rollout resume deployment/java-rolling-demo

适用于调试或分阶段更新。

总结

滚动更新是 kubernetes 为 java 应用提供的强大部署能力,它通过渐进式替换 pod,结合就绪探针优雅关闭机制,实现了零停机、高可用的持续交付。

要成功实施滚动更新,你需要:

  1. 构建健康的 java 应用:提供准确的 /actuator/health 端点;
  2. 合理配置 deployment:设置 maxunavailablemaxsurge、探针参数;
  3. 实现优雅关闭:使用 prestop hook 和 spring boot 的 graceful shutdown;
  4. 监控与回滚:建立可观测性,准备快速回滚方案。

随着云原生生态的成熟,滚动更新已成为 java 应用上线的标准姿势。掌握它,你就能在微服务时代游刃有余地交付高质量软件 🎯。

🌟 最后提醒:永远在非生产环境充分测试你的滚动更新流程!自动化、标准化、可重复,是 devops 的核心精神。

到此这篇关于java 部署滚动更新的方法(k8s rollingupdate 策略)的文章就介绍到这了,更多相关java 滚动更新内容请搜索代码网以前的文章或继续浏览下面的相关文章希望大家以后多多支持代码网!

(0)

相关文章:

版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。 如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。

发表评论

验证码:
Copyright © 2017-2026  代码网 保留所有权利. 粤ICP备2024248653号
站长QQ:2386932994 | 联系邮箱:2386932994@qq.com