当前位置: 首页 > news >正文

12.docker swarm

12.docker swarm 的基本介绍

文章目录

  • 12.docker swarm 的基本介绍
    • docker swarm中重要的概念
    • 部署swarm集群
    • 运行第一个Service
    • 如何实现Service 伸缩?
    • Swarm如何实现Failover?
    • 如何访问Service?
    • 神奇的routing mesh

docker swarm中重要的概念

从主机的层面来看, Docker Swarm 管理的是 Docker Host 集群。所以先来讨论一个重要的概念 - 集群化(Clustering)。

服务器集群由一组网络上相互连接的服务器组成,它们一起协同工作。 一个集群和一堆服务器最显著的区别在于:

集群能够像 单个 系统那样工作,同时提供高可用、负载均衡和并行处理。

如果我们部署应用和服务时选择的是多个独立的服务器而非集群,资源的整体利用率则很难达到最优,因为我们无法提前知道如何分布这些应用才能达到资源利用的最大化。而且,应用使用资源的趋势是波动的,早上某些服务可能需要大量的内存,而下午使用量就降下来了。提前指定应用应该运行在哪个服务器上会丧失业务的弹性,当某个服务器宕机了,我们不得不手工将受影响的应用迁移到其他服务器上。

实现集群化后我们的思维方式就必须改变了:不再考虑一个一个的服务器,而是将集群看做是一个整体

部署应用时,我们只考虑需要多少内存和 CPU,而不是考虑会使用那台服务器的内存和 CPU。我们不应该关心应用会被部署在哪里,我们关心的是运行这个应用需要哪些资源,然后将它部署到集群,集群管理程序(比如 Docker Swarm)会搞定这些细节。

集群整体容量的调整是通过往集群中添加和删除主机节点实现的。但不管做怎样的操作,集群始终还是一个整体。

本章,我们会创建 Docker Swarm 集群、部署应用、伸缩扩展应用,以及对应用执行滚动升级。

Docker Swarm Mode

Docker v1.12 是一个非常重要的版本, Docker 重新实现了集群的编排方式。在此之前,提供集群功能的Docker Swarm 是一个单独的软件,而且依赖外部数据库(比如 Consul、etcd 或 Zookeeper)。

从 v1.12 开始, Docker Swarm 的功能已经完全与 Docker Engine 集成,要管理集群,只需要启动

Swarm Mode。安装好 Docker ,Swarm 就已经在那里了,服务发现也在那里了(不需要安装 Consul 等外部数据库)。

相比 Kubernetes,用 Docker Swarm 创建集群非常简单,不需要额外安装任何软件,也不需要做任何额外的配置。很适合作为学习容器编排引擎的起点。

重要概念

在创建集群之前,先明确几个概念。

swarm

swarm 运行 Docker Engine 的多个主机组成的集群。

从 v1.12 开始,集群管理和编排功能已经集成进 Docker Engine。当 Docker Engine 初始化了一个swarm 或者加入到一个存在的 swarm 时,它就启动了 swarm mode。

没启动 swarm mode 时, Docker 执行的是容器命令;运行 swarm mode 后, Docker 增加了编排service 的能力。

Docker 允许在同一个 Docker 主机上既运行 swarm service,又运行单独的容器。

node

swarm 中的每个 Docker Engine 都是一个 node,有两种类型的 node: managerworker

为了向 swarm 中部署应用,我们需要在 manager node 上执行部署命令, manager node 会将部署任务拆解并分配给一个或多个 worker node 完成部署。

manager node 负责执行编排和集群管理工作,保持并维护 swarm 处于期望的状态。 swarm 中如果有多个 manager node,它们会自动协商并选举出一个 leader 执行编排任务。

woker node 接受并执行由 manager node 派发的任务。默认配置下 manager node 同时也是一个worker node,不过可以将其配置成 manager-only node,让其专职负责编排和集群管理工作。

work node 会定期向 manager node 报告自己的状态和它正在执行的任务的状态,这样 manager 就可以维护整个集群的状态。

service

service 定义了 worker node 上要执行的任务。 swarm 的主要编排任务就是保证 service 处于期望的状态下。

举一个 service 的例子:在 swarm 中启动一个 http 服务,使用的镜像是 httpd:latest,副本数为 3。

manager node 负责创建这个 service,经过分析知道需要启动 3 个 httpd 容器,根据当前各 worker node 的状态将运行容器的任务分配下去,比如worker1 上运行两个容器, worker2 上运行一个容器。

运行了一段时间, worker2 突然宕机了, manager 监控到这个故障,于是立即在 worker3 上启动了一个新的 httpd 容器。

这样就保证了 service 处于期望的三个副本状态。

下一节我们开始实践 Docker Swarm。

部署swarm集群

本节我们将创建三节点的 swarm 集群。

image-20250914153649511

swarm-manager 是 manager node ,swarm-worker1 和 swarm-worker2 是 worker node。

通过 docker教案 中安装的docker虚拟机,完整克隆出swarm-manager,swarm-worker1,swarm- worker2,并修改IP地址与主机名与上图相同。

所有节点的 Docker 版本均不低于 v1.12。我们的实验环境 node 的操作系统为 centos-stream-8,当然其他 Linux 也是可以的。

在 swarm-manager 上执行如下命令创建 swarm。

#初始化一个 Docker Swarm 集群,并将当前节点设置为管理节点(manager)
[root@swarm-manager ~]# docker swarm init --advertise-addr 192.168.108.30# docker swarm init:初始化 Swarm 集群的核心命令,将当前节点转换为管理节点。
# --advertise-addr 192.168.108.30:指定管理节点用于向其他节点(工作节点或其他管理节点)广播自身地址的 IP 地址。这是 Swarm 集群中节点间通信的关键配置,确保其他节点能通过此 IP 连接到管理节点。

--advertise-addr指定与其他 node 通信的地址。

docker swarm init输出告诉我们:

① swarm 创建成功, swarm-manager 成为 manager node。

② 添加 worker node 需要执行的命令。

③ 添加 manager node 需要执行的命令。

执行 docker node ls 查看当前 swarm 的 node,目前只有一个 manager。

[root@swarm-manager ~]# docker node ls

复制前面的 docker swarm join 命令,在 swarm-worker1swarm-worker2 上执行,将它们添加到 swarm 中。命令输出如下:

注意:三个节点将防火墙zone设置为trust

[root@swarm-manager ~]# firewall-cmd --set-default-zone=trusted 
[root@swarm-worker1 ~]# firewall-cmd --set-default-zone=trusted
[root@swarm-worker2 ~]# firewall-cmd --set-default-zone=trusted
[root@swarm-worker1 ~]# docker swarm join --token SWMTKN-1-5it8t4f2tbrmxuhahkwp7i4jzhq7q14l35tkjotbiln0bztrzw-bmwlgmv1inatgm1hpl1739ncy 192.168.108.30:2377
This node joined a swarm as a worker.[root@swarm-worker2 ~]# docker swarm join --token SWMTKN-1-5it8t4f2tbrmxuhahkwp7i4jzhq7q14l35tkjotbiln0bztrzw-bmwlgmv1inatgm1hpl1739ncy 192.168.108.30:2377
This node joined a swarm as a worker.

docker node ls 可以看到两个 worker node 已经添加进来了。

[root@swarm-manager ~]# docker node ls

如果当时没有记录下 docker swarm init 提示的添加 worker 的完整命令,可以通过docker swarm

[root@swarm-manager ~]# docker swarm join-token worker

注意:此命令只能在 manager node 上执行。

至此,三节点的 swarm 集群就已经搭建好了,操作还是相当简单的。

下一节我们将在 swarm 中部署第一个 service。

运行第一个Service

上一节我们创建好了 Swarm 集群, 现在部署一个运行 httpd 镜像的 service,执行如下命令:

[root@swarm-manager ~]# docker service create --name web_server httpd 

部署 service 的命令形式与运行容器的 docker run 很相似, --name 为 service 命名, httpd 为镜像的名字。

通过 docker service ls 可以查看当前 swarm 中的 service。

[root@swarm-manager ~]# docker service ls

REPLICAS 显示当前副本信息, 1/1 的意思是 web_server 这个 service 期望的容器副本数量为 1,目前已经启动的副本数量为 1。也就是当前 service 已经部署完成。命令 docker service ps 可以查看service 每个副本的状态。

[root@swarm-manager ~]# docker service ps web_server

可以看到 service 唯一的副本被分派到 swarm-worker2,当前的状态CURRENT是 Running ,达到期望DESIRED的状态 Running

如果觉得不放心,还可以到 swarm-worker2去确认 httpd 容器已经运行。

[root@swarm-worker2 ~]# docker ps

当前 web_server 在 swarm 中的分布如图所示。

image-20250914154616086

目前为止 Service 与普通的容器还没有太大的不同,下一节我们就要学习容器编排引擎的强大功能了,首先从应用伸缩 Scale Up/Down 开始。


如何实现Service 伸缩?

上一节部署了只有一个副本的 Service,不过对于 web 服务,我们通常会运行多个实例。这样可以负载均衡,同时也能提供高可用。

swarm 要实现这个目标非常简单,增加 service 的副本数就可以了。在swarm-manager 上执行如下命令:

[root@swarm-manager ~]# docker service scale web_server=5 

副本数增加到 5,通过 docker service ls docker service ps 查看副本的详细信息。

[root@swarm-manager ~]# docker service ls[root@swarm-manager ~]#
[root@swarm-manager ~]# docker service ps web_server

5 个副本已经分布在 swarm 的所有三个节点上。

image-20250914154820061

默认配置下 manager node 也是 worker node,所以 swarm-manager 上也运行了副本。如果不希望在manager 上运行 service,可以执行如下命令:

[root@swarm-manager ~]# docker node update --availability drain swarm-manager swarm-manager

通过 docker node ls 查看各节点现在的状态:

[root@swarm-manager ~]# docker node ls

Drain 表示 swarm-manager 已经不负责运行 service,之前 swarm-manager 运行的那个副本会如何处理呢?用 docker service ps 查看一下:

[root@swarm-manager ~]# docker service ps web_server

swarm-manager 上的副本web_server.4已经被 Shutdown 了,为了达到 5 个副本数的目标,在swarm-worker2 上添加了副本 web_server.4

image-20250914154928225

前面我们的场景是 scale up,我们还可以scale down,减少副本数,运行下面的命令:

[root@swarm-manager ~]# docker service scale web_server=3 [root@swarm-manager ~]# docker service ls[root@swarm-manager ~]# docker service ps web_server

可以看到, web_server.4web_server.5 这两个副本已经被删除了。

image-20250914155007741

Service 的伸缩就讨论到这里,下一节我们学习故障切换 Failover。


Swarm如何实现Failover?

故障是在所难免的,容器可能崩溃, Docker Host 可能宕机,不过幸运的是, Swarm 已经内置了failover 策略。

创建 service 的时候,我们没有告诉 swarm 发生故障时该如何处理,只是说明了我们期望的状态(比如运行3个副本), swarm 会尽最大的努力达成这个期望状态,无论发生什么状况。

以上一节我们部署的 Service 为例,当前 3 个副本分布在 swarm-worker1 和 swarm-worker2 上。

image-20250914155142983

现在我们测试 swarm 的 failover 特性,关闭 swarm-worker1。

[root@swarm-worker1 ~]# shutdown now

Swarm 会检测到 swarm-worker1 的故障,并标记为 Down。

[root@swarm-manager ~]# docker node ls

Swarm 会将 swarm-worker1 上的副本调度到其他可用节点。我们可以通过 docker service ps 观察这个 failover 过程。

[root@swarm-manager ~]#	docker	service ps	web_server

可以看到, web_server.2 已经从 swarm-worker1 迁移到了 swarm-worker2,之前运行在故障节点swarm-worker1 上的副本状态被标记为 Shutdown 。

image-20250914155218351

Failover 就讨论到这里,下一节我们学习如何访问 Service。

如何访问Service?

前面我们已经学习了如何部署 service,也验证了 swarm 的 failover 特性。不过截止到现在,有一个重要问题还没有涉及:如何访问 service?这就是本节要讨论的问题。

为了便于分析,我们重新部署 web_server。

[root@swarm-manager ~]# docker service rm web_server ①[root@swarm-manager ~]# docker service create --name web_server --replicas=2 httpd ②[root@swarm-manager ~]# docker service ps web_server         ③

docker service rm 删除 web_server ,service 的所有副本(容器)都会被删除。

② 重新创建 service,这次直接用 --replicas=2 创建两个副本。

③ 每个 worker node 上运行了一个副本。

好了,现在 service 已经在那里了,我们如何访问呢?

要访问 http 服务,最起码网络得通吧,服务的 IP 我们得知道吧,但这些信息目前我们都不清楚。不过至少我们知道每个副本都是一个运行的容器,要不先看看容器的网络配置吧。

[root@swarm-worker1 ~]# docker ps

在 swarm-worker1 上运行了一个容器,是 web_server 的一个副本,容器监听了 80 端口,但并没有映射到 Docker Host,所以只能通过容器的 IP 访问。查看一下容器的 IP。

[root@swarm-worker1 ~]# docker inspect web_server.1.9zve246nlqedn272fgtddepok
[root@swarm-worker1 ~]#

容器 IP 为 172.17.0.2 ,实际上连接的是 Docker 默认 bridge 网络。我们可以直接在 swarm-worker1 上访问容器的 http 服务。

[root@swarm-worker1 ~]# curl 172.17.0.2
<html><body><h1>It works!</h1></body></html>

但这样的访问也仅仅是容器层面的访问,服务并没有暴露给外部网络,只能在 Docker 主机上访问。换句话说,当前配置下,我们无法访问 service web_server。

从外部访问Service

要将 service 暴露到外部,方法其实很简单,执行下面的命令:

[root@swarm-manager ~]# docker service update --publish-add 8080:80 web_server

如果是新建 service,可以直接用使用 --publish 参数,比如:

[root@swarm-manager ~]# docker service create --name web_server --publish 8080:80 --replicas=2 httpd

容器在 80 端口上监听 http 请求, --publish-add 8080:80 将容器的 80 映射到主机的 8080 端口,这样外部网络就能访问到 service 了。

[root@swarm-manager ~]# curl http://192.168.108.30:8080 <html><body><h1>It works!</h1></body></html>[root@swarm-manager ~]# curl http://192.168.108.31:8080 <html><body><h1>It works!</h1></body></html>[root@swarm-manager ~]# curl http://192.168.108.32:8080 <html><body><h1>It works!</h1></body></html>

大家可能会奇怪,为什么 curl 集群中任何一个节点的 8080 端口,都能够访问到web_server?这实际上就是使用 swarm 的好处了,这个功能叫做 routing mesh,我们下一节重点讨论。


神奇的routing mesh

接上一节案例,当我们访问任何节点的 8080 端口时, swarm 内部的 load balancer 会将请求转发给web_server 其中的一个副本。

这就是 routing mesh 的作用。

image-20250914160159959

所以,无论访问哪个节点,即使该节点上没有运行 service 的副本,最终都能访问到service。

另外,我们还可以配置一个外部 load balancer,将请求路由到 swarm service。比如配置 HAProxy,将请求分发到各个节点的 8080 端口。

image-20250914160207866

ingress网络

当我们应用 --publish-add 8080:80 时,swarm 会重新配置 service,我们看看容器都发生了哪些重要变化。

[root@swarm-manager ~]# docker	service ps web_server

是不是觉得很诧异?之前的所有副本都被 Shutdown,然后启动了新的副本。我们查看一下新副本的容器网络配置。

[root@swarm-worker1 ~]# docker inspect web_server.1.lwfdj841ph0glbrwwjucmckex 

容器的网络与 --publish-add 之前已经大不一样了。

[root@swarm-worker1 ~]# docker	network ls	

实际上:

ingress ,其作用是让运行在不同主机上的容器可以相互通信。

docker_gwbridge ,其作用是让容器能够访问到外网。

ingress网络是 swarm 创建时 Docker 为自动我们创建的, swarm 中的每个 node 都能使用

ingress

通过 overlay 网络,主机与容器、容器与容器之间可以相互访问;同时,routing mesh 将外部请求路由到不同主机的容器,从而实现了外部网络对 service 的访问。

http://www.dtcms.com/a/494296.html

相关文章:

  • C/C++内存管理详解:从基础原理到自定义内存池原理
  • 品质好物推荐怎么上大淘客网站如何做seo
  • Linux是怎么工作的--第二章
  • Web爬虫指南
  • AI越狱攻防战:揭秘大模型安全威胁
  • 《简易制作 Linux Shell:详细分析原理、设计与实践》
  • 网站 营销方案怎么在网站上添加广告代码
  • 前端面试题+算法题(三)
  • 吕口*音乐多销*-程序系统方案
  • 分享一个基于Java和Spring Boot的产品售后服务跟踪平台设计与实现,源码、调试、答疑、lw、开题报告、ppt
  • 上海AiLab扩散策略赋能具身导航!NavDP:基于特权信息的仿真到现实导航扩散策略
  • iOS 发布全流程详解,从开发到上架的流程与跨平台使用 开心上架 发布实战
  • 无线充电的工作原理是什么样子的呢?
  • led高端网站建设seo外链技巧
  • Cross Product / Vector Product / 向量外积 / 叉积 / 矢量外积 可理解为一个意思
  • 如何在 Mac 上恢复已删除的文件(包括清空了垃圾箱方法)
  • JavaScript学习第二天:常量与数据类型
  • perf 子系统宏观认知
  • P14137 「SFMOI Round II」Strange Covering Game 题解
  • 进程的状态
  • macOS 基本使用
  • 前端最新Vue2+Vue3基础入门到实战项目11-13
  • 【Linux】Linux 进程通信:System V 共享内存(最快方案)C++ 封装实战 + 通信案例,4 类经典 Bug 快速修复
  • Windows进程-dllhost.exe
  • Linux小课堂: 群组管理与文件权限控制
  • 5-4〔OSCP ◈ 研记〕❘ SQL注入攻击▸基于 UNION 的SQLi
  • 黑龙江住房建设部网站qwins是哪个网站做的
  • Spring容器的refresh()方法
  • 接口测试难点总结
  • 《C++ Stack 与 Queue 完全使用指南:基础操作 + 经典场景 + 实战习题》