当前位置: 首页 > news >正文

(十七)Flink 容错机制

目录

分布式快照

Checkpoint

Checkpoint 模式

Checkpoint 配置

非对齐 Checkpointing

状态存储

Savepoint

分配算子 ID

Savepoint 操作

Checkpoint 与 Savepoint 区别

作业重启与故障恢复策略

重启策略

恢复策略


对于不间断 24 小时运行的程序来说,容错至关重要。Flink 定期对每个算子的所有状态进行持久化快照,并将这些快照复制到更持久的地方,例如分布式文件系统。如果发生故障,Flink 可以恢复应用程序的完整状态并恢复处理,就好像没有出现任何问题一样。

本章我们针对 Checkpoint、Savepoint、作业重启调度策略做详细介绍。

分布式快照

Flink 容错机制的核心部分是绘制分布式数据流和算子状态的一致快照。这些快照充当一致的检查点,系统在发生故障时可以回退到这些检查点。Flink 绘制这些快照的灵感来自分布式快照的标准 Chandy-Lamport 算法,并专门针对 Flink 的执行模型进行了定制。

  • 快照:是 Flink 作业状态全局一致镜像的通用术语。快照包括指向每个数据源的指针(例如,到文件或 Kafka 分区的偏移量)以及每个作业的有状态运算符的状态副本,该状态副本是处理了 sources 偏移位置之前所有的事件后而生成的状态。
  • Checkpoint:一种由 Flink 自动执行的快照,其目的是能够从故障中恢复。Checkpoints 可以是增量的,并为快速恢复进行了优化。
  • 外部化的 Checkpoint:通常 checkpoin

相关文章:

  • 封装websocket
  • UE5用蓝图实现物体A始终朝向物体B |Find Look at Rotation|
  • 网络攻击原理及过程
  • 遭遇“git”命令找不到的报错,开发者如何迅速应对
  • 深入学习SQL优化的第四天
  • Android fork 进程 process(init/Zygote/SystemServer)
  • 新课程研究是第一批学术期刊吗?
  • Django后端架构开发:从匿名用户API节流到REST自定义认证
  • 如何在 mind+ 中编写 python 程序
  • SQL 对版本进行排序遇到的问题
  • 软考架构-构件技术
  • 鸿蒙高级开发者认证题库
  • 谷粒商城实战笔记-261-商城业务-订单服务-页面环境搭建
  • 普通项目解决跨域问题和springSecurity解决跨域问题
  • 卸载重装redis
  • Linux自旋锁和读写锁
  • 用java实现的一个本地文件队列,支持并发消费与顺序消费
  • Spring Cloud Consul精选面试题及答案
  • 大模型如何赚钱,杀手级应用是什么、创业机会在哪里?
  • C3面:ASP.NET MVC 中还有哪些注释属性用来验证?
  • 山东一景区怕游客赶不到海撒三千斤蛤蜊:给游客提供情绪价值
  • 韩国代总统、国务总理韩德洙宣布辞职
  • 过去24小时中美是否就关税问题进行过接触?外交部:没有
  • 迎接八方来客:全国多地“五一”假期党政机关大院停车场免费开放
  • 李铁案二审驳回上诉,维持一审有期徒刑20年的判决
  • 牛市早报|今年第二批810亿元超长期特别国债资金下达,支持消费品以旧换新