当前位置: 首页 > news >正文

Kafka 和 Flink的讲解

一、Kafka:分布式消息队列

1. 核心概念
  • ​角色​​:Kafka 是一个分布式、高吞吐量的​​消息队列​​(Pub-Sub 模型),用于实时传输数据流。
  • ​关键术语​​:
    • ​Producer​​(生产者):发送数据的客户端(如传感器、应用日志)。
    • ​Consumer​​(消费者):接收和处理数据的客户端(如 Flink、Spark)。
    • ​Broker​​:Kafka 集群中的单个节点,负责存储和转发消息。
    • ​Topic​​:数据流的分类名称(如 user_click_events)。
    • ​Partition​​:Topic 的分区,每个分区是一个有序的、不可变的消息队列。
    • ​Offset​​:消息在分区中的唯一位置标识。
    • ​Consumer Group​​:一组消费者协同消费一个 Topic 的数据。
2. 核心特性
  • ​高吞吐​​:支持每秒百万级消息传输。
  • ​持久化​​:消息持久化存储(可配置保留时间)。

相关文章:

  • git 的常用指令
  • Java面试42-什么是幂等?如何解决幂等性问题?
  • Axure RP9教程 【数据传输】(页面值传递)| 作用域 :全局变量、局部变量
  • kafka分区策略详解
  • MCP+Blender创建电力塔
  • H.265视频编码技术:下一代高清时代的数字密码
  • NO.73十六届蓝桥杯备战|搜索算法-剪枝与优化-记忆化搜索|数的划分|小猫爬山|斐波那契数|Function|天下第一|滑雪(C++)
  • 视频分析设备平台EasyCVR携手高空抛物AI智能分析技术,打造住宅小区头顶安全智能防线
  • 高级:数据库面试题全攻略
  • whisper 语音识别
  • 游戏引擎学习第210天
  • [unity 字体] 导入中文字体、字库
  • 实操日志之Windows Server2008R2 IIS7 配置Php7.4.3
  • 【漫话机器学习系列】188.概率相关概念详解(Notions Of Probility)
  • 开箱即用!推荐一款Python开源项目:DashGo,支持定制改造为测试平台!
  • MySQL、Oracle 和 PostgreSQL 是三种主流的关系型数据库的主要原理性差异分析
  • 去中心化固定利率协议
  • 【Scrapy】Scrapy教程11——XPath详解
  • MongoDB常见面试题总结(上)
  • 软件工程第四章习题
  • web网站开发视频/流量购买网站
  • wordpress 一键/百度网站优化
  • 广西专业做网站的公司/品牌营销的四大策略
  • 免费字体设计图片/搜索引擎优化包括哪些
  • 网站开发 免代码/重庆百度推广优化排名
  • 网站做竞价/游戏推广平台