当前位置: 首页 > wzjs >正文

徐州网站优化推广一个平台网站开发

徐州网站优化推广,一个平台网站开发,办公装修怎么设计,网站维护年费以下是 Flink SQL Savepoint 最佳实践,涵盖配置、触发、恢复及注意事项,高效管理作业状态: 一、Savepoint 的配置与触发 1. 基础配置 存储路径:在 flink-conf.yaml 中全局设置 Savepoint 存储目录,避免每次手动指定路…

以下是 Flink SQL Savepoint 最佳实践,涵盖配置、触发、恢复及注意事项,高效管理作业状态:


一、Savepoint 的配置与触发

1. 基础配置

  • 存储路径:在 flink-conf.yaml 中全局设置 Savepoint 存储目录,避免每次手动指定路径:
    state.savepoints.dir: hdfs:///flink/savepoints
    
  • 检查点模式:优先选择 EXACTLY_ONCE 语义保障数据一致性:
    SET 'execution.checkpointing.mode' = 'EXACTLY_ONCE';
    SET 'execution.checkpointing.interval' = '5min';  -- 建议与业务容忍延迟匹配
    
  • 并行度与状态后端:根据作业规模选择 RocksDB(大状态)或 FsStateBackend(小状态):
    SET 'parallelism.default' = 4;
    SET 'state.backend' = 'rocksdb';
    

2. 触发 Savepoint

  • 命令行触发:通过 Flink CLI 手动触发(需指定 JobID):
    ./bin/flink savepoint <job-id> [target-directory]
    
  • SQL 客户端触发:在 SQL 作业停止时自动触发 Savepoint:
    STOP JOB '<job-id>' WITH SAVEPOINT;
    
  • 编程触发:通过 REST API 或调度工具(如 Airflow)自动化触发流程。

二、Savepoint 的恢复与容错

1. 恢复作业

  • 从指定路径恢复
    ./bin/flink run -s hdfs:///savepoints/savepoint-xxxx <jar-file>
    
  • SQL 客户端恢复:在启动作业前设置 Savepoint 路径:
    SET 'execution.savepoint.path' = 'hdfs:///savepoints/savepoint-xxxx';
    START JOB '<new-job-id>';  -- 提交新作业后重置路径
    RESET 'execution.savepoint.path';  -- 避免影响后续作业
    
  • 处理状态不匹配:若作业逻辑变更导致状态无法映射,添加 --allowNonRestoredState 跳过无效状态。

2. 版本兼容性

  • Flink 版本升级:确保新旧版本状态格式兼容(参考 Flink 官方兼容性文档)。
  • 作业逻辑变更:若修改算子 UID 或拓扑结构,需验证 Savepoint 恢复可行性(优先保留旧算子 UID)。

三、维护与管理

1. 定期清理

  • 删除过期 Savepoint 以释放存储空间:
    ./bin/flink savepoint -d hdfs:///savepoints/savepoint-xxxx
    
  • 配置自动化清理策略(如保留最近 3 个 Savepoint)。

2. 监控与验证

  • 状态一致性检查:通过 Flink Web UI 或日志确认 Savepoint 生成成功。
  • 恢复测试:定期从 Savepoint 恢复测试作业,确保关键业务流程不受影响。

四、针对 SQL 作业的特殊优化

1. 元数据管理

  • 使用 Catalog(如 Hive Catalog)持久化表定义和元数据,避免恢复时表结构丢失。
  • 示例:
    CREATE CATALOG hive WITH ('type' = 'hive', 'hive-conf-dir' = '/path/to/hive-conf');
    USE CATALOG hive;
    

2. 外部系统协同

  • 事务性 Sink:选择支持事务的 Connector(如 Kafka、JDBC),确保端到端 Exactly-Once。
  • 偏移量对齐:对于 Kafka 等 Source,启用 group.idauto.offset.reset 策略,避免数据重复或丢失。

五、典型场景示例

场景:升级 Flink 版本

  1. 触发当前作业的 Savepoint:
    ./bin/flink savepoint <job-id>
    
  2. 停止原作业并部署新版本 Flink 集群。
  3. 从 Savepoint 恢复作业:
    ./bin/flink run -s hdfs:///savepoints/savepoint-xxxx -c <main-class> <new-jar>
    
  4. 验证数据一致性及性能指标。

注意事项

  • 算子 UID手动指定 SQL 算子的 UID,避免自动生成 ID 因代码变更导致恢复失败。
  • 增量 Checkpoint:对于超大状态作业,启用 RocksDB 增量 Checkpoint 减少存储开销。
  • 网络与存储优化:确保 Savepoint 目录的 IO 带宽充足,避免生成/恢复超时。

通过上述实践,可显著提升 Flink SQL 作业的可靠性和运维效率。建议结合具体业务场景调整参数策略。

http://www.dtcms.com/wzjs/589613.html

相关文章:

  • 做任务领取礼品的网站企业网站有哪些举几个例子
  • 台州路桥做网站的公司有哪些多用户商城系统源码教程
  • ps制作个人网站crm管理系统app
  • 网站制作公司制作网站招网络推广招聘
  • 专注做一家男人最爱的网站网站建设建设
  • php网站后台制作有哪些做图纸的网站
  • 成都网站建设需要多少钱北京综素网址
  • wordpress 小说站主题广州网站策划公司
  • 网站首页特效国产的主题wordpress
  • 佛山网站上排名vi企业整套设计公司
  • 中山市路桥建设有限公司网站上海网站建设 网站制作
  • 网站后台功能模块建筑企业入渝备案查询
  • 大兴区制作网站的公司wordpress 获取当前分类名
  • 网站建设合同的要素厦门网站建设的公司哪家好
  • 网站建设类的职位取名网站怎么做
  • 建立公司网站需要注意什么关键词seo培训
  • 河南便宜网站建设wordpress後台建站
  • 在线安装软件网站开发wordpress 4.8中文
  • 包头网站开发公司软文广告是什么意思
  • 网页设计实训报告总结万能模板沈阳网站关键词优化哪家好
  • 做门户网站怎么赚钱深圳网站建站建设
  • c2c商城网站建设费用微商城怎么做
  • 北京市电力建设公司网站温州网页制作模板
  • 长春火车站电话咨询电话设计师网红cad图库
  • 网站维护需要做那些事建设网站公司需要哪些证件
  • 夜夜做新郎网站在线视频网站开发的结构图
  • 制作软件的网站wordpress编辑可视化
  • 电商网站建设教学总结安徽建设工程信息网官
  • 做水果蔬菜生意网站保定网站建设模板联系方式
  • 建设网站要什么资料网站拥有权