当前位置：首页 > news >正文

Kafka 和 Flink的讲解

news 2025/10/9 3:57:18

一、Kafka：分布式消息队列

1. 核心概念

角色：Kafka 是一个分布式、高吞吐量的消息队列（Pub-Sub 模型），用于实时传输数据流。
关键术语：
- Producer（生产者）：发送数据的客户端（如传感器、应用日志）。
- Consumer（消费者）：接收和处理数据的客户端（如 Flink、Spark）。
- Broker：Kafka 集群中的单个节点，负责存储和转发消息。
- Topic：数据流的分类名称（如 user_click_events）。
- Partition：Topic 的分区，每个分区是一个有序的、不可变的消息队列。
- Offset：消息在分区中的唯一位置标识。
- Consumer Group：一组消费者协同消费一个 Topic 的数据。

2. 核心特性

高吞吐：支持每秒百万级消息传输。
持久化：消息持久化存储（可配置保留时间）。

http://www.dtcms.com/a/120363.html

相关文章：

git 的常用指令

Java面试42-什么是幂等？如何解决幂等性问题？

Axure RP9教程【数据传输】（页面值传递）| 作用域：全局变量、局部变量

kafka分区策略详解

MCP+Blender创建电力塔

H.265视频编码技术：下一代高清时代的数字密码

NO.73十六届蓝桥杯备战|搜索算法-剪枝与优化-记忆化搜索|数的划分|小猫爬山|斐波那契数|Function|天下第一|滑雪(C++)

视频分析设备平台EasyCVR携手高空抛物AI智能分析技术，打造住宅小区头顶安全智能防线

高级：数据库面试题全攻略

whisper 语音识别

游戏引擎学习第210天

[unity 字体] 导入中文字体、字库

实操日志之Windows Server2008R2 IIS7 配置Php7.4.3

【漫话机器学习系列】188.概率相关概念详解（Notions Of Probility）

开箱即用！推荐一款Python开源项目：DashGo，支持定制改造为测试平台！

MySQL、Oracle 和 PostgreSQL 是三种主流的关系型数据库的主要原理性差异分析

去中心化固定利率协议

【Scrapy】Scrapy教程11——XPath详解

MongoDB常见面试题总结（上）

软件工程第四章习题

JavaScript/React中，...（三个连续的点）被称为扩展运算符（Spread Operator）或剩余运算符（Rest Operator）

【蓝桥杯2024省B】好数三种解法全解析 | C/C++暴力法→剪枝优化→构造法演进

特权FPGA之数码管

一文详解OpenGL环境搭建：Ubuntu20.4使用CLion配置OpenGL开发环境

苍穹外卖（1）-部分环境配置（git、数据库）

React-06React中refs属性（字符串refs,回调形式，React.createRef() ）

JVM考古现场（十七）：鸿蒙初辟——从太极二进到混沌原初的编译天道

[ctfshow web入门] web24

oracle 11g密码长度和复杂度查看与设置

Debian系统_主板作为路由器_测试局域网设备间网速