当前位置: 首页 > news >正文

Spark-Streaming

Spark-Streaming概述

DStream实操

案例一:WordCount案例

需求:使用 netcat 工具向 9999 端口不断的发送数据,通过 SparkStreaming 读取端口数据并统计不同单词出现的次数

实验步骤:

  1. 添加依赖

<dependency>
    <groupId>org.apache.spark</groupId>
    <artifactId>spark-streaming_2.12</artifactId>
    <version>3.0.0</version>
</dependency>

  1. 编写代码

val sparkConf = new SparkConf().setMaster("local[*]").setAppName("streaming")
val ssc = new StreamingContext(sparkConf,Seconds(3))

val lineStreams = ssc.socketTextStream("node01",9999)
val wordStreams = lineStreams.flatMap(_.split(" "))
val wordAndOneStreams = wordStreams.map((_,1))
val wordAndCountStreams = wordAndOneStreams.reduceByKey(_+_)
wordAndCountStreams.print()

ssc.start()
ssc.awaitTermination()

  1. 启动netcat发送数据

nc -lk 9999

结果:

相关文章:

  • 【深度学习新浪潮】新视角生成的研究进展调研报告(2025年4月)
  • 软件测试之接口测试常见面试
  • 第48讲:空间大数据与智慧农业——时空大数据分析与农业物联网的融合实践
  • ecovadis评级范围,如何拿到ecovadis评级高分
  • 局域网内,将linux(Ubuntu)的硬盘映射成Windows上,像本地磁盘一样使用
  • 健康生活新指南
  • ESM 内功心法:化解 require 中的夺命一击!
  • Spring 中 @Component, @Repository, @Service 的区别及示例代码
  • 学习Docker遇到的问题
  • 广州市白云区粤荣职业培训学校副校长余智强获聘广州培训质量督导员
  • 高性能数据库集群:分库分表
  • LeetCode 热题 100_分割等和子集(89_416_中等_C++)(动态规划)
  • 如何通过证书认证安全登录堡垒机、防火墙和VPN?安当KSP密钥管理系统助力企业实现零信任身份验证
  • C++ linux打包运行方案(cmake)
  • postman工具
  • 全能 Sui 技术栈,构建 Web3 的未来
  • 掌握 Altium Designer:轻松定制“交换器件”工具栏
  • Python 设计模式:享元模式
  • XPath 语法入门
  • Vue 实例 VM 访问属性
  • 韩国代总统、国务总理韩德洙宣布辞职,将择期宣布参选总统
  • 秦洪看盘|资金切换主线,重构市场风格
  • 新片|《我仍在此》定档5月,《新·驯龙高手》同步北美上映
  • 十四届全国人大常委会第十五次会议在京闭幕
  • 向总书记汇报具身智能发展的“稚辉君”:从期待到兴奋再到备受鼓舞
  • 合肥一季度GDP为3003.88亿元,同比增长6.6%