当前位置: 首页 > news >正文

浙江制造品牌建设网站做微信网站公司名称

浙江制造品牌建设网站,做微信网站公司名称,小程序发布要多少钱,wordpress插件访客背景 对几十万条用户历史存量数据写入,且存在大对象的基础上。kafka消费进行消费写mysql超时。导致上游服务调用时异常,CPU飙高异常。 大对象解释 大对象的定义与危害 1. 什么是大对象? JVM 内存分配机制:Java 中对象优先分配…

背景

对几十万条用户历史存量数据写入,且存在大对象的基础上。kafka消费进行消费写mysql超时。导致上游服务调用时异常,CPU飙高异常。

大对象解释

大对象的定义与危害

1. 什么是大对象?
  • JVM 内存分配机制:Java 中对象优先分配在 Eden 区,但单个对象超过 -XX:PretenureSizeThreshold 阈值(默认与类型相关)时,会直接进入老年代。

  • 典型场景

    • 超大数组/集合(如 byte[10MB]List 存储万级元素)

    • 未分页的数据库查询结果(一次性加载百万行数据)

    • 缓存滥用(缓存未压缩的图片/文件)

    • 未及时释放的流处理数据(如未关闭的 InputStream

2. 大对象如何引发 CPU 飙升?
  • GC 压力

    • 频繁 Full GC:老年代被大对象快速填满,触发 STW 的 Full GC,CPU 资源被垃圾回收线程独占。

    • CMS/G1 并发失败:并发回收期间老年代空间不足,退化为单线程 Full GC,导致长时间停顿。

  • 序列化开销:RPC 调用中,大对象的序列化/反序列化(如 Protobuf、JSON)会显著消耗 CPU。

  • 数据处理瓶颈:遍历或操作大对象(如排序、转换)导致 CPU 密集型计算。

二、大对象问题定位技巧

1. 诊断工具
  • 内存分析

    • jmap -histo:live <pid> 直方图统计对象分布

  • GC 日志

    • -XX:+PrintGCDetails -XX:+PrintGCDateStamps -Xloggc:/path/to/gc.log

    • 关注 Full GC 频率和 OldGen 使用率

三、大对象问题规避策略

1. 架构设计优化
  • 分页/分段处理:

// 错误:一次性查询全量数据
List<User> users = userDao.findAll(); // 正确:分页分批处理
int pageSize = 500;
for (int page = 0; ; page++) {List<User> batch = userDao.findByPage(page, pageSize);if (batch.isEmpty()) break;processBatch(batch);
}
2. 编码规范
  • 避免方法内大对象分配:

// 反例:在频繁调用的方法中创建大数组
public void process() {byte[] buffer = new byte[10 * 1024 * 1024]; // 10MB 临时数组// ...
}// 正例:复用对象或使用对象池
private static final ThreadLocal<ByteBuffer> bufferHolder = ThreadLocal.withInitial(() -> ByteBuffer.allocate(1024));
  • 及时释放资源
3. JVM 调优

Kafka消费者Rebalance机制

一、Kafka消费者机制与问题根源

消费者组(Consumer Group):多个消费者共同消费一个Topic的分区,实现负载均衡。每个分区仅由一个消费者处理。

Rebalance触发条件:

1.消费者加入或离开组(如宕机、主动下线)。

2.消费者超过 max.poll.interval.ms 未发送心跳(默认5分钟)。

问题现象:偏移量(Offset)未提交,消费者被判定为死亡,触发Rebalance,消息重新分配给其他消费者,但新消费者同样无法及时处理,形成恶性循环。

核心配置参数:

max.poll.records:单次Poll拉取的最大消息数(默认500)

max.poll.interval.ms:两次Poll操作的最大允许间隔(默认5分钟)

问题原因:处理500条消息耗时超过5分钟,导致消费者被认为失效,触发Rebalance,消息被重复分配但处理仍超时,最终服务崩溃。

二、处理逻辑与性能瓶颈

数据处理耗时分析

  • 业务逻辑复杂度:每条消息需查询历史数据18万条,涉及复杂计算或多次数据库交互。

  • 数据库写入瓶颈:

单条插入 vs 批量插入:单条插入导致频繁事务提交,效率低下。

索引与锁竞争:写入时索引维护和行锁可能引发性能下降。

  • 代码示例(低效写入):

@KafkaListener(topics = "init_data_topic")
public void handleMessage(List<Message> messages) {for (Message msg : messages) {// 逐条查询18万条历史数据List<HistoryData> data = queryHugeData(msg.getUserId());// 逐条写入MySQLdata.forEach(d -> jdbcTemplate.update("INSERT INTO table ...", d));}
}

资源消耗与CPU飙升

  • GC压力:频繁创建大对象(如18万条数据的List)导致Young GC频繁,最终引发Full GC,CPU被GC线程占用。

  • 线程阻塞:同步写入数据库时,线程因IO等待而阻塞,线程池满载后任务堆积,进一步加剧延迟。

三、排查方向与优化策略

1.Kafka消费者配置调优

2.数据处理逻辑优化

分页查询与批量写入:

将18万条历史数据分页查询,避免一次性加载到内存。

使用MySQL批量插入(INSERT INTO ... VALUES (...), (...)),减少事务开销。

// 分页查询示例
int pageSize = 1000;
for (int page = 0; ; page++) {List<HistoryData> batch = queryByPage(msg.getUserId(), page, pageSize);if (batch.isEmpty()) break;batchInsertToMySQL(batch); // 批量写入
}

总结

总而言之,对于大对象或者数据量过大的数据,每次查和写入的数据量都要严格把控!!单次查询和写入数据量不超过1000!!!!!

http://www.dtcms.com/a/549235.html

相关文章:

  • Babylon.js中ArcRotateCamera.interpolateTo 方法使用备忘
  • 【OD刷题笔记】- CPU算力分配
  • iOS 抓包工具有哪些,开发者的选型与实战指南
  • 测试过程涉及python自动化及其他相关面试问题汇总
  • 免费网站建设讯息全站加速 wordpress
  • 哪里网站建设公司比较好网站建设销售工作职责
  • 推荐一款免费的语音识别网站,上传音频即可
  • 笔记C++语言,太焦虑了
  • 分公司一般做网站吗音乐网站建设目标
  • Java 21 虚拟线程 vs 缓存线程池与固定线程池
  • 在线开发培训网站建设小型餐饮店面设计
  • ZYNQ USB按键读写操作详解:从裸机到Linux系统的完整实现
  • 如何在Windows桌面实现自由悬浮计时?
  • BEV环视感知算法从环境部署开始
  • 看上去高端的网站深圳培训学校
  • 狂飙与重构:机器人IPO浪潮背后的系统焦虑与感知进化
  • 21.静态NAT
  • 做头像的网站wordpress拖拽式
  • 【C++】位运算算法习题
  • 券商上云,不止AI和大数据,还有USB Server
  • 软件设计师知识点总结:面向对象技术(设计模式)
  • 广西建设局建设行政主管部网站企业app开发企业
  • Python 实战:Web 漏洞 Python POC 代码及原理详解(3)
  • VMware替代 | ZStack ZSphere与VMware NSX安全策略对比
  • BigDecimal
  • 【电子元器件·10】低功耗继电器 —— 磁保持继电器;有源蜂鸣器、无源蜂鸣器
  • 示范专业网站建设网站开发体会范文
  • LeetCode 411 - 最短独占单词缩写
  • 日语学习-日语知识点小记-构建基础-JLPT-N3阶段-二阶段(11):文法和单词-第三课
  • 网站建设方案和报价家装设计师工资高吗