当前位置: 首页 > news >正文

flink生成水位线记录方式--基于特殊记录的水位线生成器

背景

在flink基于事件的时间处理中,水位线记录的生成是一个很重要的环节,本文就来记录下几种水位线记录的生成方式的其中一种:基于特殊记录的水位线生成器

基于特殊记录的水位线生成器

我们发送的事件中,如果带有某条特殊记录的元素代表了某种进度的标识的话,我们可以基于这条特殊的记录生成水位线,这样我们当收到这条特殊记录时就知道这个记录的时间戳之前的记录都已经全部收到了,也就是可以基于这条特殊记录发出水位线了。代码如下所示:

public class SpecialRecordWaterMark extends AssignerWithPunctuateWaterMarks{

public long extractTimeStamp(event Event, previousTs long){
// 抽取记录的时间戳
 return event.getTimeStamp();
}

public WaterMark checkAndGetNextWaterMark(event Event, extractedTs long){
if(event is '特殊记录'){
	//发出水位线,这里的delay可以为0,也可以为比如一分钟等数值
	return new WaterMark(extractedTs - delay)
}else{
//不发出水位线记录
}
}
}

总结

基于特殊记录的水位线生成器的最大问题时,flink是并行处理输入记录的,你如何能确保特殊记录是比正常记录后处理的?我能想到的场景是比如kafka队列,所有你要处理的记录都在某个分区中有序,特殊记录也是分区有序的情况下才能使用这种方法生成水位线

相关文章:

  • elementui引入弹出框报错:this.$alert is not defined 解决方案
  • 【新版】系统架构设计师 - 未来信息综合技术
  • ROS2 中的轻量级、自动化、受控回放
  • 第五章 函数
  • java_equals的使用
  • jmeter录制https脚本
  • 【python入门篇】列表简介及操作(2)
  • springboot和vue:八、vue快速入门
  • 小谈设计模式(8)—代理模式
  • 纯css html 真实水滴效果
  • C++实现集群聊天服务器
  • What is an HTTP Flood DDoS attack?
  • inndy_echo
  • Mysql各种锁
  • C语言文件操作与管理
  • 信息安全第四周
  • 开源校园服务小程序源码 校园综合服务小程序源码 包含快递代取 打印服务 校园跑腿【带详细部署教程】
  • Mybatis 二级缓存(使用Redis作为二级缓存)
  • Springboot: Spring Cloud Gateway 使用的基本概念及配置介绍
  • Docker 网桥、docker0 网桥和 --net host:平台差异、使用方式和场景介绍简介:
  • 缔造“水饺皇后”的香港,也是被移民塑造的香港
  • 阿根廷发生5.8级地震
  • 解放日报:硬科企业由此迈出“市场第一步”
  • 澎湃读报丨央媒头版集中刊发社论,庆祝“五一”国际劳动节
  • 美国第一季度经济环比萎缩0.3%
  • 国铁集团去年收入12830亿元增3%,全年铁路运输利润总额创新高