当前位置: 首页 > news >正文

KafkaSpark

Kafka

Kafka基本概念

卡夫卡是一个分布式、分布订阅的消息系统,作为消息中间件使用。

设计上是一个分布式的、分区的和可复制的提交日志服务。

Kafka的优势

分布式系统,易于扩展。
高吞吐量,支持发布和订阅模式。
支持多地复制,自动平衡消费者。
消息持久化到磁盘,支持批量消费。

消息队列模式

点对点模式:一对一的消费方式,消费者主动拉取消息。
发布订阅模式:一对多的消费方式,消息可以被多个消费者使用。

卡夫卡的角色与特性

主要角色

卡夫卡特性
高吞吐量低延迟:每秒处理几十万条数护,延迟最低几毫秒。
可扩展性;支持集解扩展。
持久性和可靠性:消息持久化到本地破盘,支持数据备份。
容错性:允许集群中节点失败(若副本数量为n,则允许n-1个节点失败)。
高并发性,支持数千个客户端同时读写。

Kafka集群的安装

登录Kafka的官网Apache Kafka。

Kafka是Java和Scala语言开发的。所以安装Kafka之前必须要保证先安装JDK。

Kafka依赖于Zookeeper的选举机制,所以安装Kafka之前还要保证Zookeeper已经被安装好了。

首先进到software目录当中,如下图所示:

Kafka常用的配置解释

安装部署Spark

步骤

解压缩文件,并重命名为spark-yarn。

修改配置文件

相关文章:

  • 初始SpringBoot
  • Java | 深拷贝与浅拷贝工具类解析和自定义实现
  • 数据预处理:前缀和算法详解
  • Vue3 + TypeScript 实现二维码生成与展示
  • poi生成横向文档以及复杂表头
  • 驱动开发硬核特训 · Day 18:深入理解字符设备驱动与子系统的协作机制(以 i.MX8MP 为例)
  • 欧拉计划 Project Euler54(扑克手牌)题解
  • MySQL运算符
  • stack和queue的学习
  • 【实证分析】ESG发展对企业新质生产力影响的研究—来自中国A股上市企业的经验
  • ROS第十二梯:ros-noetic和Anaconda联合使用
  • Python常用的第三方模块之【pymysql库】操作数据库
  • HarmonyOS 5.0应用开发——MVVM模式的应用
  • CF2103F Maximize Nor
  • AI 人工智能模型:从理论到实践的深度解析⚡YQW · Studio ⚡【Deepseek】【Chat GPT】
  • 深度学习中的黑暗角落:梯度消失与梯度爆炸问题解析
  • springboot+vue 支付宝支付(沙箱方式,测试环境使用)
  • VUE Element-ui Message 消息提示组件自定义封装
  • 如何在编译命令中添加灰度标识
  • cnas认证注意事项,cnas认证审核有效期?cnas认证难吗?
  • 《一鸣惊人》五一特别节目:以戏曲为桥梁,展现劳动者的坚守
  • 王毅谈金砖国家开展斡旋调解的经验和独特优势
  • 七部门联合发布《终端设备直连卫星服务管理规定》
  • 山西太原一小区发生爆炸,造成1人遇难21人受伤2人失联
  • 国家网信办举办在欧中资企业座谈会,就数据跨境流动等进行交流
  • 广东省副省长刘红兵跨省调任湖南省委常委、宣传部长