当前位置: 首页 > news >正文

在VMWare上搭建Flume集群

文章目录

  • 1. 实战概述
  • 2. 实战步骤
    • 2.1 下载Flume安装包
    • 2.2 在master主节点上安装配置Flume
      • 2.2.1 上传Flume安装包到master指定目录
      • 2.2.2 将Flume安装包解压缩到指定目录
      • 2.2.3 给Flume配置环境变量
      • 2.2.4 编辑自定义Agent配置文件
    • 2.3 在slave1从节点上安装配置Flume
      • 2.3.1 从master主节点分发Flume到slave1从节点
      • 2.3.2 从master主节点分发环境配置文件到slave1从节点
    • 2.4 在slave2从节点上安装配置Flume
      • 2.4.1 从master主节点分发Flume到slave2从节点
      • 2.4.2 从master主节点分发环境配置文件到slave2从节点
    • 2.5 测试Flume集群监视日志变化
      • 2.5.1 准备测试日志文件
      • 2.5.2 启动 Flume Agent
      • 2.5.3 模拟日志写入(另开终端)
      • 2.5.4 控制台查看新事件
  • 3. 实战总结

1. 实战概述

  • 本次实战部署了 Apache Flume 1.11.0 分布式日志采集系统,在 master、slave1 和 slave2 三节点完成安装与环境配置,并通过自定义 Agent 配置实现对本地日志文件的实时监听与控制台输出,验证了 Flume 数据采集流程的正确性与稳定性,为后续对接 Kafka 或 HDFS 奠定基础。

2. 实战步骤

2.1 下载Flume安装包

  • 下载网址:https://www.apache.org/dyn/closer.lua/flume/1.11.0/apache-flume-1.11.0-bin.tar.gz
    在这里插入图片描述

  • apache-flume-1.11.0-bin.tar.gz下载到本地
    在这里插入图片描述

2.2 在master主节点上安装配置Flume

2.2.1 上传Flume安装包到master指定目录

  • 进入/opt目录,上传Flume安装包
    在这里插入图片描述

  • 执行命令:ll apache-flume-1.11.0-bin.tar.gz
    在这里插入图片描述

2.2.2 将Flume安装包解压缩到指定目录

  • 执行命令:tar -zxvf apache-flume-1.11.0-bin.tar.gz -C /usr/local
    在这里插入图片描述
  • 执行命令:ll /usr/local/apache-flume-1.11.0-bin
    在这里插入图片描述

2.2.3 给Flume配置环境变量

  • 执行命令:vim /etc/profile
    在这里插入图片描述
  • 执行命令:source /etc/profile,让配置生效
    在这里插入图片描述

2.2.4 编辑自定义Agent配置文件

  • 执行命令:cd $FLUME_HOME/conf,进入Flume配置目录
    在这里插入图片描述

  • 执行命令:vim test.conf
    在这里插入图片描述

    # 定义 agent 名称
    a1.sources = r1
    a1.channels = c1
    a1.sinks = k1# 配置 source(监听文件)
    a1.sources.r1.type = exec
    a1.sources.r1.command = tail -F /var/log/test.log# 配置 channel(内存缓冲)
    a1.channels.c1.type = memory
    a1.channels.c1.capacity = 1000
    a1.channels.c1.transactionCapacity = 100# 配置 sink(输出到控制台)
    a1.sinks.k1.type = logger# 绑定 source 和 sink 到 channel
    a1.sources.r1.channels = c1
    a1.sinks.k1.channel = c1
    
  • 配置说明:该配置定义了一个 Flume Agent,使用 exec 源实时监听 /var/log/test.log 文件新增内容,通过内存通道暂存数据,最终由 logger Sink 将事件输出到控制台,适用于日志采集与调试验证。

2.3 在slave1从节点上安装配置Flume

2.3.1 从master主节点分发Flume到slave1从节点

  • 执行命令:scp -r $FLUME_HOME root@slave1:$FLUME_HOME
    在这里插入图片描述
  • 在slave1从节点上执行命令:ll /usr/local/apache-flume-1.11.0-bin
    在这里插入图片描述

2.3.2 从master主节点分发环境配置文件到slave1从节点

  • 执行命令:scp /etc/profile root@slave1:/etc/profile
    在这里插入图片描述
  • 在slave1从节点上执行命令:source /etc/profile,让配置生效
    在这里插入图片描述

2.4 在slave2从节点上安装配置Flume

2.4.1 从master主节点分发Flume到slave2从节点

  • 执行命令:scp -r $FLUME_HOME root@slave2:$FLUME_HOME
    在这里插入图片描述

  • 在slave2从节点上执行命令:ll /usr/local/apache-flume-1.11.0-bin
    在这里插入图片描述

2.4.2 从master主节点分发环境配置文件到slave2从节点

  • 执行命令:scp /etc/profile root@slave2:/etc/profile
    在这里插入图片描述

  • 在slave2从节点上执行命令:source /etc/profile,让配置生效
    在这里插入图片描述

2.5 测试Flume集群监视日志变化

2.5.1 准备测试日志文件

  • 在master主节点上执行命令:mkdir -p /var/log
    在这里插入图片描述
  • 执行命令:echo "Hello Flume~" > /var/log/test.log
    在这里插入图片描述

2.5.2 启动 Flume Agent

  • 在master主节点上执行命令

    flume-ng agent \--conf $FLUME_HOME/conf \--conf-file $FLUME_HOME/conf/test.conf \--name a1 \-Dflume.root.logger=INFO,console
    

    在这里插入图片描述
    在这里插入图片描述

  • 结果说明:Flume Agent 成功启动并开始监听 /var/log/test.log 文件,Source 通过 tail -F 实时读取日志内容,首次捕获到事件 “Hello Flume~” 并由 Logger Sink 输出原始字节流,表明数据采集流程正常,Agent 已进入稳定运行状态。

2.5.3 模拟日志写入(另开终端)

  • 另开一个master终端
    在这里插入图片描述

  • 执行命令:echo "I Love You~" >> /var/log/test.log
    在这里插入图片描述

2.5.4 控制台查看新事件

  • 切换到原来的master终端
    在这里插入图片描述
  • 结果说明:Flume 成功捕获新增日志事件,Source 实时监听 /var/log/test.log 文件变化,将内容"I love You~" 通过内存 Channel 传输至 Logger Sink,并在控制台输出原始字节流,验证了数据采集与传输流程正常。

3. 实战总结

  • 本次实战成功完成了 Apache Flume 1.11.0 在三节点集群(master、slave1、slave2)上的部署与配置。通过统一安装目录、配置环境变量并分发配置文件,确保了各节点环境一致性。在 master 节点上编写并测试了基于 exec Source、memory Channel 和 logger Sink 的 Agent 配置,成功实现对 /var/log/test.log 文件的实时监控与事件输出。通过追加日志内容验证了 Flume 的动态采集能力,控制台准确打印新增事件,证明数据流通道畅通。整个过程体现了 Flume 轻量、灵活、高可靠的数据采集特性,为后续构建日志汇聚至 Kafka 或 HDFS 的大数据流水线打下坚实基础。
http://www.dtcms.com/a/581354.html

相关文章:

  • vue_day04
  • 深入浅出 SPA/MPA
  • 怎么增加网站的关键词库个人网站申请空间
  • (已发25年8月华为云、51CTO)数组编程:编程的基础数据结构!
  • 北京网站制作设计哪个公司好网站开发人员结构配比
  • 面对未来:企业决策与适应力
  • bat 批处理实现 FFmpeg 命令压缩 MP4
  • openEuler 云原生实战:部署高性能 Redis 集群与压测分析
  • 机器学习-逻辑回归与二分类
  • 老玩家流失?基于数据驱动的游戏用户流失分析与干预策略
  • 做网站的公司名字北京注册网站
  • 如何用c 做网站hao123从网上开始
  • ThinkPHP 8 多应用模式下如何隐藏路由中的应用名
  • [SEO]网站不收录的原因及解决方法有哪些
  • conda以及Jupyter notebook的使用
  • 告别手动录入:文档抽取技术如何让RPA处理非结构化数据?
  • MIT-数字棋盘和数字三角形
  • 自助网站建设费用怎样做软件开发
  • Python面向对象和方法
  • AJAX 实例详解
  • 检测图片URL是否失效
  • 网站设计专业实验室建设与wordpress集成软件
  • 15、RabbitMQ
  • ftp怎么连接网站空间高端网站制造
  • 命名空间的内联与嵌套
  • UML建模工具Enterprise Architect如何建立和执行架构标准和规范
  • 项目一:意图识别技术与实战(案例:智能政务热线意图分类与工单自动分发系统)
  • Spec-Kit 实战指南:从零到一构建“照片拖拽相册”Web App
  • 一个网站怎么做多条线路郑州市城乡建设局证书查询
  • 河南平台网站建设价位织梦商业网站内容管理系统