当前位置：首页 > news >正文

Flink基础整理

news 2025/11/2 8:01:28

文章目录

前言
1.Flink系统架构
2.编程模型（API层次结构）
3.DataSet和DataStream区别
4.Flink的批流统一
5.Flink的状态后端
6.Flink有哪些状态类型
7.Flink并行度

前言

提示：下面是根据网络或AI整理：

1.Flink系统架构

用户在客户端提交作业（Job）到服务端。
服务端为分布式的主从架构。
- Dispatcher 服务负责提供 REST 接口来接收 Client 提交的 Job，运行 Web UI，并负责启动和派发 Job 给 JobManager。
- Resource Manager 负责计算资源（TaskManager）的管理，其调度单位是 slots。
- JobManager 负责整个集群的任务管理、资源管理、协调应用程序的分布执行，将任务调度到 TaskManager 执行、检查点（checkpoint）的创建等工作。
- TaskManager（worker）负责 SubTask 的实际执行，提供一定数量的 Slots，Slots 数就是 TM 可以并发执行的task数。当服务端的 JobManager 接收到一个 Job 后，会按照各个算子的并发度将 Job 拆分成多个 SubTask，并分配到 TaskManager 的 Slot 上执行。

2.编程模型（API层次结构）

在这里插入图片描述

最底层提供了有状态流：可以自定义状态信息和处理逻辑，但是也需要你自己管理状态的生命周期，容错，一致性等问题。
核心开发层：包括 DataStream API 和 DataSet API，它们提供了常见的数据转换，分组，聚合，窗口，状态等操作。这个层级的 api 适合大多数的流式和批式处理的场景。
声明式 DSL 层：是以表为中心的声明式 DSL，其中表可能会动态变化（在表达流数据时）。Table API 提供了例如 select、project、join、group-by、aggregate 等操作
结构化层：SQL API，它是最高层的 api，可以直接使用 SQL 语句进行数据处理，无需编写 Java 或 Scala 代码。这个层级的 api 适合需要快速响应业务需求，缩短上线周期，代码可移植性和可阅读性高，和自动调优的场景，但也最不灵活和最不具有表现力。

3.DataSet和DataStream区别

在这里插入图片描述

4.Flink的批流统一

概念: 批流统一是指Flink提供了一种统一的API和执行引擎，使得批处理（Batch Processing）和流处理（Stream Processing）可以使用相同的API进行编程，并且共享相同的执行计划和优化策略。这一特性简化了开发流程，减少了代码重复，同时提高了系统的灵活性和性能(一套代码处理流或批数据)。
体现在以下几个方面：

统一的API：无论是处理有限的数据集（批处理）还是无限的数据流（流处理），开发者都可以使用同一套API进行编程。
统一的执行引擎：Flink的执行引擎能够自动识别输入数据是批数据还是流数据，并选择合适的执行模式。
统一的状态

http://www.dtcms.com/a/170694.html

相关文章：

Python速成系列二

React hooks详解

新能源实验室电磁兼容设计优化方案论述

HTML02：网页基本信息

苍穹外卖部署到云服务器使用Docker

软考系统架构设计师系列知识点之杂项集萃（52）

观察者模式（Observer Pattern）详解

自由学习记录（58）

n8n工作流自动化平台的实操：利用本地嵌入模型，完成文件内容的向量化及入库

从 0 到 1：使用 Jetpack Compose 和智能自动化实现高效 Android UI 开发

2025 年如何使用 Pycharm、Vscode 进行树莓派 Respberry Pi Pico 编程开发详细教程（更新中）

HTML学习笔记（7）

PHP的include和require

基于STM32的心电图监测系统设计

【前端】【面试】在 Vue-React 的迁移重构工作中，从状态管理角度来看，Vuex 迁移到 Redux 最大的挑战是什么，你是怎么应对的？

力扣面试150题--相同的树

嵌入式按键原理、中断过程与中断程序设计（键盘扫描程序）

【CISCO】什么是静态路由（Static Route）？ip route 192.0.1.0 255.255.255.0 200.0.0.1

高等数学同步测试卷同济7版试卷部分上做题记录第四章不定积分同步测试卷 B卷

LeetCode刷题链表

Spring AI 实战：第四章、Spring AI多模态之看图说话

Go语言实现Kafka消息队列

【图书管理系统】环境介绍、设计数据库和表、配置文件、引入依赖

JVM——JVM是怎么实现invokedynamic的？

Go语言--语法基础4--基本数据类型--类型转换

4个纯CSS自定义的简单而优雅的滚动条样式

图片压缩与尺寸调整的便捷工具推荐

Qt输入控件（QInput Widgets）详解：从基础到实战

【leetcode】队列 + 宽搜，树形结构层序遍历的基础与变化

前端开发，文件在镜像服务器上不存在问题：Downloading binary from...Cannot download...