当前位置: 首页 > news >正文

服务器线上问题解决方案

  • 线上服务器CPU飙升,如何定位到Java代码
  • 生产环境服务器变慢,如何诊断处理
  • 线上接口负载剧增,快扛不住了,首选方案是什么

线上服务器CPU飙升,如何定位到Java代码

CPU负载过高一般是某个或某几个线程有问题。
基础版:
第1步,使用top命令找到占用CPU高的进程。
第2步,使用ps –mp命令找到进程下占用CPU高的线程ID。
第3步,使用printf命令将线程ID转换成十六进制数, 这样就得到了真正占用CPU过高的线程ID。
第4步,使用jstack命令输出线程运行状态的日志信息。
上述步骤虽然能大致定位到问题范围,但有效信息还是太少了,多数时候还是要靠猜。

进阶版使用Arthas:使用thread命令,这个命令会显示所有线程的信息,并且把CPU使用率高的线程排在前面。
根据前面的找出来的线程通过thread id,查看线程堆栈,这一步就可以定位到我们消耗比较高的方法的地方。
找到对应的方法之后我觉得应该从两方面去判断一个是xx方法是否存在循环调用、二是xx方法内部又死循环。
通过使用tt命令监听一下这个方法的调用情况,可以判断方法是否被一直的调用,这样可以筛选出第一种情况。
如果是方法内部出现死循环可以通过jad反编译查看对应的代码,也可以直接找到源码去查看。
补充:tt 命令会记录方法调用时的所有入参和返回值、抛出的异常、对象本身等数据。INDEX字段代表着一次调用,后续tt还有很多命令都是基于此编号指定记录操作,通过 -i 参数后边跟着对应的 INDEX 编号查看这条记录的详细信息。再通过-w参数,指定一个OGNL表达式,查找相关对象

生产环境服务器变慢,如何诊断处理

生产环境服务器变慢我觉得主要从三个方面去考虑:CPU利用率、磁盘I/O效率、内存瓶颈。
cpu利用率。CPU利用率过高或者CPU利用率过低,都会影响程序的处理效率。CPU利用率过高,说明当前服务器要处理的指令比较多,当CPU忙不过来的时候,指令的运行效率自然就会下降,用户的感受就是程序响应变慢了。
(针对这个问题,我们可以使用top命令查询当前系统中占用CPU过高的进程,并定位到这个进程中比较活跃的线程。再通过jstack命令打印当前虚拟机的线程快照,根据快照日志排查问题代码。(这个得看你简历有没有写Arthas这个技术栈)
Arthas使用thread, 命令查询当前系统中占用CPU过高的进程,并通过thread id,查看线程堆栈查询到对应的方法,同时根据快照日志排查问题代码。)
如果CPU利用率过低,则说明程序资源使用不够,可以增加线程数量提升程序性能。
磁盘I/O效率。在程序运行过程中会直接或者间接涉及一些与磁盘I/O相关的操作,比如程序直接读/写磁盘或者程序依赖的第三方组件对磁盘进行持久化存储,此时磁盘I/O效率就会对程序运行效率产生影响。
针对这种情况可以使用iostat命令查看,如果磁盘负载较高,可以针对性地进行优化。比如,借助缓存系统,减少磁盘I/O次数;用顺序写替代随机写入,减少寻址开销;使用mmap替代read/write,减少内存拷贝次数。另外,磁盘I/O效率可以通过CPU与负载的非线性关系体现出来。当负载增大时,系统吞吐量不能有效增大,CPU不能线性增长,则很可能是磁盘I/O出现阻塞。

补充:mmap与read/wirte对比以及mmap优缺点:
https://nineright.github.io/2014/03/12/mmap-io.html

内存瓶颈。内存作为一块临时存储数据的组件,所有CPU运行的指令都需要从内存中去读/写。内存的合理使用可以减少应用和磁盘的I/O频率,减少网络I/O的频率,极大地提升I/O性能。
JVM对内存的合理分配,能够避免频繁的YGC和FULL GC。可以通过使用jvm:查看当前 JVM 的相关信息,包括堆大小、GC 策略、线程数等。当内存使用率较高时,查出大对象或者占用内存最多的对象,以及排查是否存在内存泄漏的问题。如果堆内存文件正常,则可以考虑是堆外内存被大量使用导致出现问题,此时需要借助操作系统的pmap命令查出进程的内存分配情况。如果CPU和内存使用率都很正常,那么就需要进一步开启GC日志,分析用户线程暂停的时间、各部分内存区域GC次数和时间等指标,这里可以借助jstat命令或可视化工具GCEasy等。如果问题出在GC上,则考虑是不是内存不足,然后根据垃圾对象的特点进行参数调优,使用更适合的垃圾收集器,用thread命令分析各个线程的状态。

线上接口负载剧增,快扛不住了,首选方案是什么

遇到这样的问题,第一反应应该是增加缓存。因为,增加缓存是解决系统性能问题最快速、最高效的方案,它能够快速提升系统的线性吞吐量,效果也最为明显。这就相当于是用空间来换取时间。//曾经有人说过,缓存是解决性能问题的万金油,哪里存在性能瓶颈,就往哪里加缓存。

但是程序都已经上线了,增加缓存还来得及吗?
因为在增加缓存时需要改代码,所以,临时解决方案就是增加节点。随后,将程序紧急部署到新的节点上,在流量入口增加限流和分发。但是增加节点自然会增加成本,所以增加缓存才是最优的解决方案。
缓存的设计思想在架构设计中十分常见。比如我们每天用的操作系统,不管是Windows、Linux,还是Mac OS都有系统缓存、用户缓存。磁盘有磁盘缓存区、CPU有CPU缓存区。再比如,在我们常用的经典框架中,也经常使用到缓存,Spring有IoC缓存,MyBatis有一级缓存、二级缓存。在架构设计中,可以说缓存无处不在。
因此,当并发量过高扛不住的时候,可以优先采用缓存来缓解负载压力。比如将读取频繁的数据写到缓存中,将动态页面静态化。在加上缓存之后,如果负载压力依然过大,则再考虑增加限流策略,比如消息队列;如果在增加限流后还是压力过大,则再考虑增加服务器节点

相关文章:

  • Redis持久化之RDB
  • OSCP备战-mr-robot靶机详细解法
  • docker问题记录
  • 2025/5/25 学习日记 linux进阶命令学习
  • 有限时间 vs 固定时间 vs 预定时间滑模:稳定性分析与仿真验证方法对比(下)
  • 基于diffusion的图像编辑与inpaint
  • mysql数据库之备份
  • 【PhysUnits】13 减法操作(sub.rs)
  • 右键管理工具,让你电脑实用更加顺滑!
  • 第11次课 while循环
  • 第三方检测机构如何凭借专业公正保障软件质量?资质有哪些?
  • 深入解析Java组合模式:构建灵活树形结构的艺术
  • PostgreSQL windows安装
  • 【AI Study】第三天,Python基础 - 同NumPy类似的类库
  • Global Securities Markets 第二章知识点总结
  • 英语六级-阅读篇
  • 嵌入式学习 D27:系统编程--进程
  • ind_knn_ad环境搭建和运行【用自己的数据集】
  • MySQL(36)如何使用CASE进行条件表达式?
  • dify_plugin数据库中的表总结
  • 实战网站开发/企业网站建设论文
  • 芜湖做网站公司/企业seo排名有 名
  • 中国最好的网站建设公司/免费的seo网站下载
  • 海口快速建站公司推荐/危机舆情公关公司
  • 个人网站能挂广告吗/做博客的seo技巧
  • 石家庄最好的网站建设公司哪家好/国际军事新闻最新消息今天