当前位置: 首页 > wzjs >正文

网站排名掉了简单网页设计成品

网站排名掉了,简单网页设计成品,做视频网站要多大的服务器,网站地址栏图标制作前言: FE(Frontend)是 Apache Doris 集群架构中的“大脑”,负责元数据管理、查询解析和调度等关键任务。一旦 FE 出现问题,整个集群的稳定性和可用性将受到严重影响。因此,掌握 FE 故障定位与排查方法对于保…

前言: FE(Frontend)是 Apache Doris 集群架构中的“大脑”,负责元数据管理、查询解析和调度等关键任务。一旦 FE 出现问题,整个集群的稳定性和可用性将受到严重影响。因此,掌握 FE 故障定位与排查方法对于保障 Doris 运行至关重要。本文将结合官方文档与实际经验,系统梳理 FE 问题排查的完整路径。


在这里插入图片描述

一、FE 元数据结构与排查文档

在排查 Doris 问题时,理解 FE 元数据的组织方式非常重要。以下是官方提供的两篇核心文档,建议在遇到问题时首先阅读:

  • 🔗 FE 元数据设计原理
  • 🔗 元数据操作失败的排查方法

二、排查 FE 问题需要收集哪些信息?

定位问题,第一步是“取证”。这里列出你在排查 FE 相关故障时必须要收集的文件与信息清单

✅ 日志类文件

  1. FE 日志目录(fe/log/)下的:

    • fe.log:主日志,核心排查依据
    • fe.audit.log:用户行为与 SQL 审计
    • fe.gc.log:GC 详情,有助分析是否存在 GC pause 过长
    • fe.out:FE 控制台日志,有时比 fe.log 更早打印异常栈(尤其是FE core的信息都在这里记录)
  2. BDBJE 元数据日志(fe/doris-meta/bdb/je.info.0

    • 注意:日志时间为 UTC,需+8小时换算为北京时间
  3. 版本信息:

    • 执行 start_fe.sh --version 查看 commit ID
  4. FE 状态:

    • 执行 SHOW FRONTENDS 获取当前所有 FE 节点状态与角色
  5. Prometheus 监控指标(如接入 Grafana,使用Doris Manager也是可以的)

    • JVM 堆内存使用率
    • 线程数
    • 当前导入 job 数
    • checkpoint 失败次数等
  6. 如果怀疑“卡住”或“死锁”,请提供以下内容:

    • jstack -l <pid> 获取线程状态
    • jmap -heap <pid> 查看堆内存分布
    • jmap -histo:live <pid> 查看对象统计
    • jmap -dump:file=xxx.hprof <pid> 获取内存镜像用于离线分析
  7. 主机级别的信息:

    • dmesg -T > dmesg.txt 查看操作系统层异常(看看是不是OOM)
    • CPU、内存、磁盘、网络使用情况指标

三、FE 挂掉的常见原因与排查方法

1. 无法达成多数写副本,FE 崩溃

Insufficient acks for policy:SIMPLE_MAJORITY. Need replica acks: 1. Missing replica acks: 1
  • 可能原因:

    • GC 暂停时间过长,导致心跳超时
    • 堆内存不足,JVM 被 OOM
    • Follower 节点挂掉,Master 成为孤岛
    • Fsync 写磁盘耗时过长(je.info.0 会有 fsync 超时日志)
  • 建议做法:

    • 查看 GC 日志中是否存在"concurrent mode failure"或"promotion failed"
    • 使用 jmap 分析堆中是否存在大对象或泄漏
    • 检查是否有节点宕机或物理资源(CPU/磁盘)异常

2. JVM 堆内存 OOM

  • 现象:FE 异常退出,日志出现 OOM 相关堆栈信息。

  • 建议做法:

    • 优化导入 label 保留参数,避免内存长期被事务占用:
      label_keep_max_second = 21600
      streaming_label_keep_max_second = 21600
      
    • 将 GC 策略从 CMS 改为 G1,并设置合理的 pause 时间
      JAVA_OPTS="-Xmx8g -XX:+UseG1GC -XX:MaxGCPauseMillis=200"
      
      注意⚠️:Doris 2.1.x之后默认使用G1

3. 操作系统 OOM Killer 杀死 FE

  • 排查路径:

    • 使用 dmesg -T | grep -i java 查看 OOM 记录
    • 检查是否其他进程抢占了系统内存
  • 建议做法:

    • FE 和 BE尽量不要混合部署
    • 适当增加机器内存(终极解决办法)

四、FE 启动失败的常见原因

1. BDBJE 元数据损坏或磁盘空间不足

  • 报错提示:DiskLimitExceptionmeta out of date
  • 检查点:
    • 查看 je.info.0 是否有异常
    • 检查磁盘空间是否充足

2. 集群时钟不同步

  • 报错:Clock delta: xxx ms. between Feeder
  • 建议所有节点启用 ntpd 或 chronyd 同步时间

3. 启动 jar 包不一致或 jar 包冲突

  • 如高版本的 meta 使用了低版本 Doris jar 启动
  • 或 jar 包残留版本冲突,导致反序列化失败

4. 节点间网络通信受限

  • 防火墙导致 heartbeat、editlog 传输失败

五、其他 FE 常见故障与处理建议

1. FE 卡住、死锁、CPU 飙高

  • 检查点:
    • jstack 查看是否存在死锁
    • Prometheus 查看 GC 时间、LoadJob 数量
    • 检查 checkpoint 是否阻塞主线程

2. checkpoint 无法完成导致 image 巨大

  • /doris-meta/image/ 下 image 文件几十 GB
  • 可能因为导入 label 未清理、ccr binlog 堆积等导致

3. SHOW FRONTENDS 执行缓慢

  • 原因可能是域名解析问题/ 线程泄漏 / 内存泄漏导致 FE 状态无法快速响应

六、常用 Java 内存分析工具

工具用途
jmap查看堆结构、对象统计、dump 内存镜像
jstack查看线程状态、排查死锁
GCEasy分析 GC 日志
[JProfiler / Eclipse MAT]分析 .hprof 文件,定位内存热点
Arthas在线火焰图分析、方法跟踪

七、Grafana FE 常用监控指标

  1. JVM Heap 使用率:是否频繁达到 70% 阈值
  2. 线程数量:是否存在异常增长,是否持续活跃
  3. 导入 Job 数量:是否持续过高未清理
  4. checkpoint 成功率与耗时:是否频繁失败或超时
  5. editlog 写入延迟:是否磁盘卡顿或主线程阻塞
  6. CPU/内存/磁盘 IO/网络:系统资源瓶颈是否影响 FE

结语

FE 是 Apache Doris 的“心脏”,掌握其运行机制与问题排查路径,是数据库平台稳定运行的基础。建议在生产环境中部署完善的日志采集、监控系统,并对 GC 策略、内存设置等进行合理调优。如果你遇到 FE 崩溃、卡顿、无法启动等问题,不要轻易使用 recovery 方法拉起,请先查日志、取 dump、看指标,再分析、再修复。搞不定的话,可以联系社区同学,他们嘎嘎热心~


文章转载自:

http://Xpmik1in.hbjqn.cn
http://lqGG9caf.hbjqn.cn
http://ObRjG2sE.hbjqn.cn
http://rFDrR9w4.hbjqn.cn
http://HneZjAqs.hbjqn.cn
http://afbKyGsO.hbjqn.cn
http://fdpQ3Vtq.hbjqn.cn
http://gb7g8MzA.hbjqn.cn
http://9yl19UeE.hbjqn.cn
http://wucnWgcS.hbjqn.cn
http://qGQ5DrlL.hbjqn.cn
http://uwb4PARd.hbjqn.cn
http://sFyPMj4E.hbjqn.cn
http://A22xFHbp.hbjqn.cn
http://ZefUhYQL.hbjqn.cn
http://c6UH7qKl.hbjqn.cn
http://EkDQsgum.hbjqn.cn
http://EcSg6EIs.hbjqn.cn
http://v34tubY5.hbjqn.cn
http://wZVh2E59.hbjqn.cn
http://fO7cimQn.hbjqn.cn
http://pdmifoyq.hbjqn.cn
http://DuugexoK.hbjqn.cn
http://YDIXsGP0.hbjqn.cn
http://TcLyHaX2.hbjqn.cn
http://dqAacqI6.hbjqn.cn
http://iBLSfmd7.hbjqn.cn
http://UOJp1s9n.hbjqn.cn
http://nJPJHnu1.hbjqn.cn
http://OB3E0IYz.hbjqn.cn
http://www.dtcms.com/wzjs/698220.html

相关文章:

  • 网站建设与网页设计试卷手机网站模板更换方法
  • 免费开发个人小程序的平台小红书seo排名优化
  • 博山做网站公司html5企业网站开发
  • 做海购的网站广告设计专业学校有哪些
  • 中车网站建设的优缺点上海网站建设网站开发
  • 网站制作的书籍徐州金网网站建设
  • 手机版网站建设报价wordpress飘窗
  • 专门找事做的网站明会红网站
  • 基础网站怎么做网络营销都有哪些内容
  • 网站图片下载 代码网站建设+临沂
  • 快速建站公司有哪些装修网站建设方案书
  • 分类信息网站建设专职做除尘骨架的网站
  • 荣成市有做网站的吗合川网站建设
  • 成都网站建设公司有哪几家自做网站的步骤
  • 弹幕网站开发难么最新wordpress教程视频教程
  • 网站建设期末总结企业网站 单页
  • 随州做网站生意怎么样asp网站开发教程百度云
  • 温州市城建设计院网站wordpress jquery
  • python3网站开发wordpress在什么系统下搭建
  • 建设厅网站初始数据入库海外seo推广公司
  • 潜江做网站的公司外国人做数学视频网站
  • 淘客网站系统免费源码ui设计是什么软件
  • 自己可以做网站生意好做吗中铁建设集团北京工程有限公司
  • 网站上线前要做哪些准备php做网站登陆验证
  • 如何做网站seo韩小培中国建筑装饰网饶明富
  • 建设旅游网网站软件vi企业设计
  • 百度站长工具seo中信建设网站
  • 开发网站怎么挣钱专门做代工产品的网站
  • 微信商城和网站建设wordpress 破解商场主题
  • 怎么开通网站和进行网页设计玉树营销网站建设哪家好