当前位置: 首页 > news >正文

优化记录 -- 记一次搜索引擎(SOLR)优化

业务场景

某服务根据用户相关信息,使用搜索引擎进行数据检索

软件配置

solr 1台:32c 64g 数据10gb左右,版本 7.5.5
应用服务器1台:16c 64g
应用程序 3节点

问题产生现象

1、因业务系统因处理能不足,对业务系统硬件平台进行升级,升级变更为 16c64g —> 32c64g 增加 16c
2、业务系统升级,处理能力增加,对原搜索引擎服务器的qps有所提升,原qps 1500 提升至 2600左右
3、搜索引擎负载发生极大变化,从原始负载60左右,提升至85左右,远超预期

分析问题

应用层:

链接数未提升,仅提升qps,应该不会对solr 造成过大的影响

SOLR 层

分析缓存

检查os 剩余内存

使用 htop 观测剩余内存还有将近30g,因此决定调整 solr 相关缓存配置
在这里插入图片描述

分析 SOLR 线程栈

1、使用 jstack pid >pid.jstack 导出solr 线程运行情况
2、通过 IBM JCA469.jar 分析工具,检查线程锁
在这里插入图片描述
发现500+线程等待log锁
在这里插入图片描述
检查 solr 相关日志配置
发现 solr 7.5.5 使用 log4j2日志框架,且使用同步日志输出模式
在这里插入图片描述

调整方案

增加SOLR缓存,提升缓存命中率

原始配置

  <filterCache class="solr.FastLRUCache"
                 maxRamMB="2048"
                 autowarmCount="150000"/>

    <queryResultCache class="solr.LRUCache"
                      size="65536"
                      initialSize="65536"
                      autowarmCount="0"/>

    <documentCache class="solr.LRUCache"
                   size="65536"
                   initialSize="65536"
                   autowarmCount="0"/>

更新后配置

  <filterCache class="solr.FastLRUCache"
                 maxRamMB="2048"
                 autowarmCount="150000"/>

    <queryResultCache class="solr.LRUCache"
                      size="131070"
                      initialSize="131070"
                      autowarmCount="0"/>

    <documentCache class="solr.LRUCache"
                   size="131070"
                   initialSize="131070"
                   autowarmCount="0"/>
                   

增加JVM 内存

Xmx16g ---> Xmx24g

使用全局异步日志打印日志输出

在 solr.in.sh 添加JVM启动参数

-Dlog4j2.contextSelector=org.apache.logging.log4j.core.async.AsyncLoggerContextSelector

调整后效果如下

os 负载情况

调整前
在这里插入图片描述
调整后
在这里插入图片描述

线程锁情况

在这里插入图片描述
调整后
在这里插入图片描述

相关文章:

  • Redis默认序列化方式乱码原因及解决办法
  • 【C/PTA —— 15.结构体2(课外实践)】
  • 基于spring boot电子商务系统
  • 维基百科文章爬虫和聚类:高级聚类和可视化
  • Query、BasicDBObject、BasicDBList查询mongodb不同使用方式
  • Linux 权限
  • 异想天开 | 如何实现PXE可视化?批量主机PXE如何监控状态?
  • HTML中使用JavaScript实现一个简单的鼠标悬停特效。
  • 【概率统计】如何理解概率密度函数及核密度估计
  • 企业微信HOOK开发接口调用,发送语音消息
  • 《系统架构设计师教程(第2版)》第2章-计算机系统基础知识-04-计算机网络
  • 免费百度SEO优化工具,百度SEO优化排名工具
  • Linux篇:进程间通信
  • 数据结构与程序的关系
  • 1、命名空间、C++的复合类型、缺省参数
  • 第四章 SpringCloud Alibaba 实现Ribbon负载均衡
  • C#基础与进阶扩展合集-进阶篇(持续更新)
  • docker搭建nginx实现负载均衡
  • 学生成绩管理系统(Java)
  • [node] Node.js的Web 模块
  • 网警打谣:传播涉刘国梁不实信息,2人被处罚
  • 浙江一家长称小学老师打孩子还威胁要从3楼扔下,当地警方已立案
  • 女生“生理期请病假要脱裤子证明”?高校回应:视频经处理后有失真等问题
  • 浙江省委金融办原副主任潘广恩被“双开”
  • 李峰已任上海青浦区委常委
  • 澎湃·镜相第二届非虚构写作大赛初选入围名单公示