当前位置: 首页 > wzjs >正文

南通个人网站制作制作网页小图片

南通个人网站制作,制作网页小图片,飞言情做最好的小说网站,免费网站入口网站免费进1. 背景 运维侧持续反馈了几次线上业务程序 A 出现宕机告警的信息,重启后一段时间后又出现宕机,这里针对最后一次告警进行深入排查和分析。 首先这一次故障出现在 2024-03-14 04:18:23,和以往的宕机故障略有不同,以往的现象是切…

1. 背景

运维侧持续反馈了几次线上业务程序 A 出现宕机告警的信息,重启后一段时间后又出现宕机,这里针对最后一次告警进行深入排查和分析。

首先这一次故障出现在 2024-03-14 04:18:23,和以往的宕机故障略有不同,以往的现象是切换 GC 日志文件时卡住然后进程挂掉,这一次是写 GC 日志时进程卡住进入假死状态,但是这一次是过了两分钟后能够自动恢复;

部署方式:一台物理机虚拟化出来多台 VM,业务模块部署再 VM 上;

2. 问题排查过程

2.1 程序监控分析

在监控图中,程序问题发生前的各项指标没有明显的变化,当时处于凌晨业务低峰期,程序的压力也非常低,按照目前的各项指标来看,初步判断该问题和程序业务功能无关,如果问题根因是由程序业务功能导致,那么有可能是缺失了监控指标。
在这里插入图片描述

2.2 程序日志分析

在 grafana 上查看 loki 收集到的程序日志,发现该故障期间的两分钟没有任何输出;
在这里插入图片描述
通过日志进行聚合统计出来的流量图也显示在故障期间没有任何日志输出;
在这里插入图片描述
小结:确认故障期间程序处于挂起/假死状态,这个状态下所有业务功能都不工作,有可能导致这个问题的原因大概有:

  1. 出现了 Full GC、mixed GC 等让业务线程停顿的 GC 类型,且 GC 时间长达两分多钟;
  2. 出现了 swap 空间交换,swap 空间交换会让进程挂起;
  3. 其他操作系统、机器级别的异常。

2.3 GC 日志分析

通过查看 GC 日志,发现进程停顿了 156 秒,看上去是一次耗时非常长的 GC,且 GC 类型为 mixed GC, mixed GC 会对老年代进行回收,回收时会让业务线程停止工作;
在这里插入图片描述

通过对 GC 日志进行筛选,看到实际 GC 时间大于 100 毫秒的只有 4 次,最长的一次是 156 秒,其次是 760 毫秒,这两次 GC 时间比较高,存在一个共同点是 read > user + sys;
在这里插入图片描述

看到这里就让人很疑惑了,比较合理的应该是 real <= user + sys;

  1. user 表示在用户态执行的 GC 操作耗时,例如垃圾标记等动作,如果回收的数据比较多,可能这个值比较大,在多核 CPU + 多线程 GC 的情况下甚至大于 real;
  2. sys 表示在内核态执行的 GC 操作耗时,例如在操作系统内核中执行的代码耗时;
  3. real 表示实际让业务线程停止工作的耗时。

由于这里发现了 real > user + sys,看上去这部分耗时从 GC 日志中没法找到是哪个步骤的耗时,出现这种现象可能是 GC 日志没有打印齐全,或者有一部分耗时无法被 JVM 统计到,于是再看看 JVM 启动参数。

以下是模块 A 的启动 JVM 参数(已省略不必要的),可以看到使用的是 G1 垃圾收集器,-verbose:gc -XX:+PrintGCDetails -XX:+PrintGCDateStamps -XX:+PrintGCApplicationStoppedTime 这几个参数其实已经可以打印比较详细的 GC 日志了,也能够记录到各个步骤的耗时,所以这里判断这个问题可能是和操作系统甚至是机器硬件有关系;

-server -Xms500M -Xmx8192M -XX:+HeapDumpOnOutOfMemoryError -XX:+UseG1GC -verbose:gc -XX:+PrintGCDetails -XX:+PrintGCDateStamps -XX:+PrintGCApplicationStoppedTime -XX:+UseGCLogFileRotation -XX:NumberOfGCLogFiles=5 -XX:GCLogFileSize=30m -Xloggc:./logs/gc.%p.log

结合下图的 GC 过程,可以看到,线程停顿时间其实包括写 GC 日志的时间,再次断定和操作系统甚至是机器硬件有关系;
在这里插入图片描述

2.4 机器监控分析

通过监控可以看到,问题发生的时候,刚好机器的硬盘利用率达到了 100%,持续时间为 2 分钟左右,和告警恢复时间吻合,初步判断该故障和硬盘利用率有关。
在这里插入图片描述

通过监控程序的源码发现,该指标数据来源于 iostat -dxm 2 2 这个命令,如下图所示,这个命令可以查到硬盘的各项指标,例如读写速度、IO 请求占比等,而监控图 上看到的则是下图中最后的一列;
在这里插入图片描述

查看 iostat 的文档,%util 列的含义表示的是 IO 请求占比监控硬盘时表示的是硬盘 IO 请求占比,监控网络时表示网络 IO 请求占比,这个占比越高,说明读写越繁忙,不过查阅资料后发现在现在硬盘有并行读写功能后这个占比即使到了 100% 也无法说明 IO 饱和了,还需要结合其他指标来看;
在这里插入图片描述

这里结合硬盘读写这个指标来看,当时的读写速度都为 0,说明这台机器有很多 IO 请求,但是硬盘处于无法读写状态,结合 CPU 使用情况这项指标,初步判断是这个时候是往硬盘发送了多次的 IO 请求,所以 CPU 升高,但是硬盘处于无法读写状态,所有的 IO 请求都被挂起,最终 %util 也占到 100% 了。
在这里插入图片描述

3. 问题确认

通过和运维侧的沟通,确认到物理机有数据备份的操作,备份时需要对硬盘进行进行读写,最终可能引发了该问题;

4. 参考

https://www.linkedin.com/blog/engineering/archive/eliminating-large-jvm-gc-pauses-caused-by-background-io-traffic
https://blog.gceasy.io/2016/12/08/real-time-greater-than-user-and-sys-time


文章转载自:

http://M0DgdaE0.gwxsk.cn
http://I60ZAynw.gwxsk.cn
http://40rK6Kaj.gwxsk.cn
http://oaF7GPyY.gwxsk.cn
http://yJ7gKhr7.gwxsk.cn
http://KCwDydRo.gwxsk.cn
http://jN3ap6aG.gwxsk.cn
http://FGot0SOU.gwxsk.cn
http://fOfTBvNN.gwxsk.cn
http://crkD6D5R.gwxsk.cn
http://VgTAOhOU.gwxsk.cn
http://3MY1as8c.gwxsk.cn
http://InUeIYD4.gwxsk.cn
http://PHcQLpQm.gwxsk.cn
http://pFBUOyRf.gwxsk.cn
http://35NFYe1d.gwxsk.cn
http://JHz0t9La.gwxsk.cn
http://VIHQiAoL.gwxsk.cn
http://vsBaopz3.gwxsk.cn
http://n16i5bII.gwxsk.cn
http://JC6hEnap.gwxsk.cn
http://Uq3ADPJT.gwxsk.cn
http://OaRUNqL9.gwxsk.cn
http://0i0Vvhv4.gwxsk.cn
http://VchU5d0n.gwxsk.cn
http://erJfxfSq.gwxsk.cn
http://pkWbzDUW.gwxsk.cn
http://K0ohBQ3f.gwxsk.cn
http://d9VBSVtj.gwxsk.cn
http://UVRZ1eXS.gwxsk.cn
http://www.dtcms.com/wzjs/756151.html

相关文章:

  • 网站开发与设计课程设计php网站转移
  • 自己怎么做优惠卷网站汽车之家在线官网
  • 视频建设网站网站建设需要的技术设备
  • 网站建设证据保全泗阳网站定制
  • 网站百度关键词seo排名优化wordpress文章表情
  • 省建设厅执业资格注册中心网站泰安网站建设课程报告
  • 不建网站可不可以做cpa手机网站源码大全
  • 东莞整合网站建设营销大型门户网站建设方案
  • 温州定制网站建设电话wordpress本地怎么搬家
  • 网站建设与信息安全培训小结公司名称大全二字
  • 陕西住房和城乡建设厅网站6丽江网站建设 莱芜
  • 做AE视频素材在哪些网站上可以找网站建站服务的公司
  • 长岭建设局网站苏州网站建设-中国互联
  • 陕西省建设工程质量安全监督总站网站阳江58同城招聘网
  • phpcms wap网站搭建软件开发工程师绩效考核指标
  • 常熟市建设局网站网站推广计划效果
  • 衡量一个网站的指标建设银行u盾用网站打不开
  • 网页翻译器在线翻译网站优化客户报表
  • 尧都区建设厅官方网站wordpress标签球形
  • 网站架构优化微科技h5制作网站模板下载
  • 浙江省建设厅新网站人员无法查询秀色直播app软件大全
  • 有没有做软件的外包网站wordpress手机发留言
  • 建网站 维护做摄像头模组的网站
  • apmserv搭建多个网站seo如何提高网站排名
  • 建设企业银行网站多少钱网络营销工具包括
  • 怎样建设网站空间五金模具技术支持 东莞网站建设
  • 邯郸市建设局网站政策免费标志在线设计生成
  • 给公司制作网站吗个人网站
  • wordpress应用和lamp郑州百度seo排名公司
  • 深圳专业企业网站制作山东高密网站建设