当前位置: 首页 > news >正文

Flume中常见的易错的问题

一、Flume中几个常见的Source

(1)、首先先要知道几个常见的概念:断点续传、(实时)监控

断点续传的意思就是说如果在数据传输的过程中发生了故障,那么Flume能够从上次传输失败的地方继续传输数据,而不用从头开始去传输数据。

监控的意思就是各自的source组件是会监控各自的数据来源的,当数据来源中有数据到来时,就会触发组件执行,但是这里需要注意的就是实时监控,实时监控是可以实时的监控到数据来源中的数据改变的并及时的作出处理。但是有些组件的监控方式并不是实时的,而是有可能是里面的数据更改过之后,比如有一个文件的数据都已经写入才会做出处理,那这样的监控就不是实时监控,但是也是监控的一种。

(2)、几种常见的Source

2.1、Netcat Source

原理:监控某一个端口,将流经端口中的每一个文本行数据作为Event输入。

适用于能够进行实时数据采集的场景。

2.2、Spooling Directory Source

原理:监控指定目录中的文件,当文件被移动到被监控的目录中后,Source会读取文件中的内容并将其发送到Channel。

适用于批量数据的采集,但是不能实现实时的数据监控,而且不能断点续传。

2.3、Taildir Source

原理:他可以实时监控指定目录下的对个文件,一旦该目录中的数据发生了改变,就会实时读取新改变的内容,并且记录每个文件的最新采集位置。一旦发生了故障,当下次重新启动后会从采集位置开始采集数据。

适用于实时数据的采集,而且可以实现断点续传。

2.4、Exec Source

原理:可以采集通过命令行输出的数据。

http://www.dtcms.com/a/350100.html

相关文章:

  • Linux应用软件编程---网络编程(TCP:[ 其他机制、头部标志位、应用示例 ]、 HTTP:[ 万维网、概念、格式、报文、应用示例 ]
  • LoRA 微调后幻觉排查 Checklist
  • JVM之【执行引擎系统】
  • IntelJ IDEA配置GitLab教程
  • 浅谈为什么尾递归更高效?——从调用栈和汇编的视角
  • 第三方软件检测机构的核心作用(二)
  • 【AI编程】如何快速通过AI IDE集成开发工具来生成一个简易留言板系统
  • 区块链技术原理(18)-以太坊共识机制
  • 微美全息(NASDAQ:WIMI)研究基于区块链的空间数据交易框架
  • 股指期货保证金和点数是什么东西?
  • Python实现点云投影到直线、平面、柱面和球面
  • 视频孪生技术赋能电力巡检:从“平面监控”到“立体智控”的跨越
  • Vue 3 customRef 完全指南:自定义响应式引用的终极教程
  • 前端面试题vue合集
  • 华为云Stack环境中计算资源,存储资源,网络资源发放前的准备工作(中篇)
  • week4-[二维数组]平面上的点
  • win11中系统的WSL安装Centos以及必要组件
  • 基于 Prometheus+Alertmanager+Grafana 打造监控报警后台(一)-Prometheus介绍及安装
  • 企业级监控可视化系统 Prometheus + Grafana
  • 检索模型与RAG
  • 【Day 13】189.轮转数组
  • 项目文章|MeRIP-seq助力解析m6A RNA甲基化与康乃馨花衰老的调控机制
  • Day8--HOT100--160. 相交链表,206. 反转链表,234. 回文链表,876. 链表的中间结点
  • 30.throw抛异常
  • 项目前后端分离部署
  • LVM基本操作
  • LeetCode100-189轮转数组
  • 20.15 Hugging Face Whisper-large-v2中文微调实战:LoRA+混合精度单卡训练指南,3倍效率省90%显存
  • 正则表达式学习(基础)
  • AUTOSAR进阶图解==>AUTOSAR_RS_Features