当前位置: 首页 > news >正文

小白指南:Apache DolphinScheduler 补数据功能实操演示

最近使用 Apache DolphinScheduler 调度任务,不可避免地使用到【补数据】功能,经过不断尝试,终于成功运行了【补数据】功能,以此帖记录。

  • 版本说明:3.1.9

补数据功能简介

“补数据” 在 Apache DolphinScheduler 中指的是 补数据(Complement Data) 功能,用于补充执行历史时间段内的工作流实例。

补数据功能概述

补数据是工作流执行的一种特殊模式,让用户可以为过去的时间段批量创建和执行工作流实例。这在以下场景中特别有用:

  • 需要重新处理历史数据
  • 系统故障后需要补充缺失的数据处理
  • 新增数据处理逻辑后需要回填历史数据
  • 定期批量数据处理

补数据配置参数

在工作流启动界面中,补数据功能包含以下配置选项:

  1. 是否是补数据 (whether_complement_data): 开关选项,启用补数据模式

  2. 调度日期 (schedule_date): 指定需要补数据的时间范围 :

    • 支持日期选择和手动输入两种方式
    • 格式为 yyyy-MM-dd HH:mm:ss,多个日期用逗号分隔
    • 限制最多输入100条日期
  3. 执行方式 (mode_of_execution):

    • 串行执行: 按顺序逐个执行补数据任务
    • 并行执行: 同时执行多个补数据任务
  4. 并行度 (parallelism): 当选择并行执行时,可以设置自定义并行度来控制同时执行的任务数量

    • 这有助于避免大量补数据任务对服务器造成过大影响
  5. 执行顺序 (order_of_execution) :

    • 按日期升序执行: 从最早的日期开始执行
    • 按日期降序执行: 从最近的日期开始执行

使用补数据功能操作步骤

首先是工作流的任务配置,见下图

接着,保存工作流,未设置全局变量。上线工作流。

最后,运行工作流,运行参数见下图

  1. 选择补数据的日期范围
  2. 【启动参数】为定义任务时设置的参数dt,value为空即可。
  3. 点击【确定】后自动运行

验证结果

点击【工作流实例】,查看运行结果。

点击第1个实例进入,查看日志

结果显示,SQL 运行结果为补数据选择的日期,补数据功能正常可用。

Notes

补数据功能是 Apache DolphinScheduler 工作流管理中的重要特性,通过灵活的配置选项(执行方式、并行度、执行顺序等)来满足不同的数据补充需求。在使用时需要注意合理设置并行度,避免对系统资源造成过大压力。

http://www.dtcms.com/a/544560.html

相关文章:

  • 使用 JDOM 库生成 XML 文件并返回 File
  • 打工人日报#20251029
  • (107页PPT)食品零售行业数字化转型解决方案参考(附下载方式)
  • 【打靶日记】VulNyx 之 Lower5
  • Linux小课堂: LNMP架构下Discuz论坛部署全流程解析
  • 徐州网站建设推广做餐饮企业网站的费用
  • 网站搭建合同基于漏斗模型网站关键路径分析
  • 利用腾讯开源 Hunyuan3D 2.1:在 DigitalOcean GPU Droplet 上快速搭建 3D 模型
  • 【开题答辩全过程】以 多媒体素材管理系统为例,包含答辩的问题和答案
  • 聊聊高并发访问遇到过期的缓存项测试策略
  • 目标检测算法与原理(一):迁移学习
  • 第三章 线性模型
  • 【WordPress】Nova WordPress 主题:为内容创作者打造的极致体验
  • 网站一般几年创新的沈阳网站建设
  • 惠普电脑网站建设策划方案h5模板下载有哪些网站
  • 怎么做网站seo山东省旅游网站建设
  • web网页,在线%抖音,舆情%分析系统demo,基于python+web+echart+nlp+知识图谱,数据库mysql
  • 把浅色的pdf文件加深
  • Actix-Web 框架实战:构建高性能 RESTful API 服务
  • 边缘计算中针对不同类型的任务(如分类、回归)评估指标
  • 【16】C语言-编辑`task.json`文件以改变警告等级
  • Rust高性能优化与零拷贝技术深度实践
  • Linux-Redhat系统启动读取文件流程
  • React 10
  • 京东方 EV101WXM-N10 工业液晶模组技术摘要
  • Deep End-to-End Alignment and Refinement for Time-of-Flight RGB-D modules复现
  • Java-163 MongoDB 生产安全加固实战:10 分钟完成认证、最小权限、角色详解
  • MinIO 与云原生_现代化对象存储解决方案
  • 【C语言实战(63)】从0到1:51单片机GPIO控制实战秘籍
  • 金仓替代MongoDB:互联网医院聊天脱敏实战