当前位置: 首页 > news >正文

Ansible 配置并行 - 项目管理笔记

Ansible 配置并行 - 项目管理笔记

概述

在 Ansible 项目管理中,合理配置并行执行策略对提升效率和控制风险至关重要。Ansible 提供了多种方式来控制任务的执行方式,包括并发连接数控制、分批滚动执行和异步任务处理。

Playbook 执行顺序机制

基本执行流程

  • Ansible 按照 Playbook 中定义的顺序执行各个 play
  • 每个 play 中,所有主机会分批执行第一个任务,直到所有批次完成该任务
  • 然后所有主机再分批执行下一个任务,依此类推
  • 只有当所有主机完成所有任务后,Ansible 才会释放 shell 控制

潜在问题

  • 当 play 目标主机数量很大时(数百台),控制节点负载会显著增加
  • 所有主机同时执行可能导致服务中断风险(如同时更新所有 Web 服务器)

配置 forks 控制并发连接

基本概念

forks 参数控制 Ansible 同时建立的最大连接数,默认值为 5

# 查看当前 forks 设置
ansible-config dump | grep FORKS# 查看配置文件中的设置(默认为 5)
grep forks /etc/ansible/ansible.cfg

配置建议

  • Linux 受管主机:大多数任务在受管主机上运行,控制节点负载较小,可将 forks 设置为较高值(接近 100)
  • 网络设备:大多数任务在控制节点上运行,负载较大,应保持较低的 forks 值

使用示例

清单内容:

controller[webs]
node1
node3[dbs]
node2
node4

剧本内容:

---
- name: connectionhosts: alltasks:- name: conneciton 1shell: sleep 5  # 模拟耗时任务,执行5秒- name: conneciton 2debug: msg: connection 2  # 快速执行的任务

执行命令:

ansible-playbook playbook.yaml -f 2  # 使用2个并行连接执行

执行结果:

  • 第一个任务:controller 和 node1 同时完成,然后 node3 和 node2 同时完成,最后 node4 完成
  • 第二个任务:由于执行速度快,5台主机几乎同时完成

配置 serial 实现滚动更新

使用场景

当需要对服务进行更新且要求保持服务可用性时,使用 serial 关键字实现分批滚动更新

使用示例

---
- name: Rolling updatehosts: allserial: 2  # 每次更新2台主机,确保服务连续性tasks:- name: latest apache httpd package is installedyum:name: httpdstate: latest  # 安装最新版本的httpdnotify: restart apache  # 触发处理器handlers:- name: restart apacheservice:name: httpdstate: restarted  # 重启apache服务

百分比配置

serial: "30%"  # 按主机总数的百分比设置批次大小,确保至少1台主机

配置 async 实现异步任务

使用场景

适用于执行时间较长的任务(如大文件下载、系统重启等)

参数说明

  • async: 任务执行的最大超时时间(秒)
  • poll: Ansible 检查任务状态的间隔时间(秒),默认 15

使用示例

示例1:任务超时(失败)
---
- name: connectionhosts: node1tasks:- name: conneciton shell: sleep 10  # 任务需要10秒完成async: 5        # 但只等待5秒,任务会超时失败poll: 2         # 每2秒检查一次任务状态
示例2:后台下载(不等待)
---
- name: connectionhosts: node1tasks:- name: downloadget_url: url: http://192.168.48.100/ISOS/openEuler-24.03-LTS-x86_64-dvd.iso  # 大文件下载dest: /home/laomaasync: 100  # 设置100秒超时poll: 0     # 不轮询检查,立即继续后续任务(后台执行)
示例3:同步执行(默认行为)
---
- name: connectionhosts: node1tasks:- name: conneciton shell: sleep 10  # 任务需要10秒完成async: 0        # 设置为0表示使用默认同步行为poll: 2         # 每2秒检查一次任务状态

使用 wait_for 模块监控条件

文件存在检查

---
- name: test wait forhosts: node1tasks:- shell: sleep 10 && touch /tmp/hello  # 后台创建文件async: 20  # 设置20秒超时(大于sleep时间)poll: 0    # 不轮询,立即继续register: out  # 注册任务输出- name: wait for create /tmp/hellowait_for:path: /tmp/hello  # 等待文件创建state: present    # 检查文件存在delay: 5          # 开始检查前的延迟时间(秒)timeout: 30       # 总超时时间sleep: 2          # 检查间隔

端口可用性检查(系统重启场景)

---
- name: test wait_forhosts: node1,node2tasks:- name: reboot node1shell: shutdown -r now "Ansible updates triggered"  # 重启节点async: 1    # 短暂超时poll: 0     # 不等待,立即继续when: inventory_hostname == "node1"  # 只在node1上执行- name: wait for node1 come backwait_for:host: node1    # 等待的主机port: 22       # 检查的端口(SSH)state: started # 等待端口可用delay: 10      # 开始检查前的延迟(给重启留时间)sleep: 2       # 检查间隔timeout: 300   # 总超时时间(5分钟)when: inventory_hostname == "node2"  # 在node2上执行等待

使用 async_status 模块跟踪异步任务

基本用法

---
- name: test async_statushosts: node1tasks:- shell: sleep 10  # 后台任务async: 20       # 设置20秒超时poll: 0         # 不轮询,立即继续register: out    # 注册任务输出- name: wait forasync_status:jid: "{{ out.ansible_job_id }}"  # 通过任务的ansible_job_id属性跟踪register: job_result  # 注册检查结果until: job_result.finished  # 直到任务完成retries: 30    # 最大重试次数delay: 2       # 重试间隔(秒)

参数说明

  • retries: 最大重试次数(默认 3)
  • delay: 重试间隔时间(默认 5 秒)

执行效果如下图:(共尝试六次,前五次失败,第六次成功)

在这里插入图片描述

总结

result.finished # 直到任务完成
retries: 30 # 最大重试次数
delay: 2 # 重试间隔(秒)


### 参数说明- `retries`: 最大重试次数(默认 3)
- `delay`: 重试间隔时间(默认 5 秒)执行效果如下图:(共尝试六次,前五次失败,第六次成功)[外链图片转存中...(img-e1VDi2xZ-1755615838824)]## 总结通过合理配置 forks、serial、async 等参数,结合 wait_for 和 async_status 模块,可以在项目执行效率和服务稳定性之间找到最佳平衡点,实现高效的 Ansible 自动化管理。
http://www.dtcms.com/a/338773.html

相关文章:

  • 零知开源——基于STM32F407VET6与GY-271三轴地磁传感器的高精度电子罗盘设计与实现
  • TensorFlow 面试题及详细答案 120道(11-20)-- 操作与数据处理
  • Auto-CoT:大型语言模型的自动化思维链提示技术
  • OpenCV快速入门(C++版)
  • 常见的 Bash 命令及简单脚本
  • 从 0 到 1 开发校园二手交易系统:飞算 JavaAI 全流程实战
  • 无畏契约手游上线!手机远控模拟器畅玩、抢先注册稀有ID!
  • Windows/Centos 7下搭建Apache服务器
  • MySQL-分库分表(Mycat)
  • 第一章 认识单片机
  • 出现了常规系统错误: Unable to push signed certificate to host 192.168.1.2
  • 从数据表到退磁:Ansys Maxwell中N48磁体磁化指南
  • LINUX 软件编程 -- 线程
  • 决策树的学习(二)
  • MCP(模型上下文协议):是否是 AI 基础设施中缺失的标准?
  • jsPDF 不同屏幕尺寸 生成的pdf不一致,怎么解决
  • Ansible 中的文件包含与导入机制
  • java17学习笔记-Deprecate the Applet API for Removal
  • C语言基础:(十八)C语言内存函数
  • 连接远程服务器上的 jupyter notebook,解放本地电脑
  • 计算机毕设推荐:痴呆症预测可视化系统Hadoop+Spark+Vue技术栈详解
  • 生成式AI的能力边界与职业重构:从“百科实习生“到人机协作增强器
  • 人工智能学派简介
  • 当宠物机器人装上「第六感」:Deepoc 具身智能如何重构宠物机器人照看逻辑
  • Python字符串变量插值深度解析:从基础到高级工程实践
  • 安装DDNS-go
  • 【部署相关】DockerKuberbetes常用命令大全(速查+解释)
  • 便携式科研土壤监测仪:让土壤检测走进 “轻时代”
  • 大数据MapReduce架构:分布式计算的经典范式
  • 【MySQL】--- 库表操作