当前位置：首页 > news >正文

【Java面试场景题搜集总结】

news 2025/10/30 6:21:49

深分页为什么慢？我们如何进行优化？

一、为什么深分页慢？

1. 数据扫描范围过大

• 当使用 LIMIT offset, size 时，数据库需要先扫描 offset + size 条数据，然后丢弃前 offset 条，返回剩余的 size 条。
• 例如：SELECT * FROM table LIMIT 100000, 10 需要扫描 100000 + 10 条数据，但实际只返回 10 条。如果 offset 很大，数据库需要多次 I/O 读取大量数据。

2. 排序代价高

• 如果查询需要排序（ORDER BY），且排序字段无索引，数据库需要对全量数据进行排序并生成临时文件，再分页。
• 即使有索引，深分页时可能需要多次回表（查询主键索引后，再查数据行），导致性能下降。

3. 内存与磁盘压力

• 深分页可能导致大量数据被加载到内存或临时磁盘文件中，尤其是在高并发场景下，容易引发资源竞争和 I/O 瓶颈。

4. 分布式数据库的复杂性

• 在分库分表或分布式数据库中，深分页需要合并多个节点的数据，可能导致网络传输和计算开销激增。

二、优化方法

1. 游标分页（Cursor-based Pagination）

• 原理：记录上一页的最后一个记录的标识（如自增 ID 或时间戳），下一页直接基于此标识查询。
• 示例：
```sql
– 初始查询（第一页）
SELECT * FROM table ORDER BY id DESC LIMIT 10;

 -- 下一页（假设上一页最后一条记录的 id 是 10000）
 SELECT * FROM table WHERE id < 10000 ORDER BY id DESC LIMIT 10;
 ```

• 优点：避免 OFFSET，直接通过索引定位数据，性能接近 O(1)。
• 缺点：不支持跳页，只能顺序翻页。

2. 覆盖索引优化

• 原理：让查询仅通过索引即可完成，避免回表查询。
• 示例：
```sql
– 原查询（需要回表）
SELECT * FROM table ORDER BY create_time LIMIT 100000, 10;

 -- 优化后：先通过覆盖索引获取主键，再关联原表
 SELECT * FROM table 
 INNER JOIN (
     SELECT id FROM table 
     ORDER BY create_time 
     LIMIT 100000, 10
 ) AS tmp USING(id);
 ```

• 适用场景：排序字段有索引，且查询字段较少时可建联合索引。

3. 业务层限制分页深度

• 产品设计上禁止用户跳转到过深的页数（如仅允许查看前 100 页）。
• 结合搜索功能：允许用户通过筛选条件缩小数据范围（如时间范围、分类等）。

4. 异步分页或缓存

• 对热门查询结果预计算并缓存分页数据（如 Redis 缓存前 N 页）。
• 异步生成分页结果，用户获取时直接读取预存数据。

5. 分布式数据库的特殊优化

• 分页下推：在分库分表场景中，让每个分片先各自分页，再合并结果。
• 搜索引擎优化：使用 Elasticsearch 的 search_after 参数或 Scroll API 处理深分页。

三、总结

深分页的瓶颈本质是大量无效数据的扫描和排序。优化核心思路：

减少数据扫描量：通过游标分页或覆盖索引。
避免全量排序：利用索引的有序性。
业务妥协：限制分页深度或改变交互逻辑。
基础设施升级：使用更合适的存储引擎或搜索引擎（如 Elasticsearch）。

具体方案需结合业务场景（是否需要跳页、数据量级、是否分布式等）选择。

动态条件查询导致索引失效如何进行优化？

一、为什么动态条件查询会导致索引失效？

1. 条件组合不可预测

• 用户可能选择不同的字段组合查询（如 WHERE a=1 AND b=2 或 WHERE c=3 AND d=4），导致无法为所有组合建立联合索引。
• 示例：商品搜索页允许按价格、分类、品牌、评分等多个字段筛选，查询条件随机组合。

2. 隐式类型转换或函数操作

• 在条件中使用函数（如 DATE(create_time)）或隐式类型转换（如字符串转数字），导致索引失效。
• 示例：WHERE phone = 13800138000（phone 字段是字符串类型）。

3. OR 条件导致索引合并失败

• 多个 OR 连接的条件可能触发全表扫描，即使部分字段有索引。
• 示例：WHERE status = 1 OR price < 100。

4. 前导列缺失

• 联合索引要求查询条件必须包含前导列（最左前缀原则），否则索引无法生效。
• 示例：联合索引 (a, b, c)，查询 WHERE b=2 AND c=3 无法命中索引。

二、优化策略

1. 联合索引覆盖高频查询组合

• 场景：80% 的查询集中在某几个固定字段组合。
• 方法：对高频查询条件建立联合索引。
• 示例：
sql -- 高频查询：按分类 + 品牌 + 价格排序 CREATE INDEX idx_category_brand_price ON products(category_id, brand_id, price);

2. 改写查询条件，避免索引失效

• 避免隐式转换：确保条件值与字段类型一致。
sql -- 错误写法（phone 是字符串类型） SELECT * FROM users WHERE phone = 13800138000; -- 正确写法 SELECT * FROM users WHERE phone = '13800138000';
• 避免对索引列使用函数：将函数操作转移到参数侧。
sql -- 错误写法（索引失效） SELECT * FROM orders WHERE DATE(create_time) = '2023-10-01'; -- 正确写法（利用索引范围扫描） SELECT * FROM orders WHERE create_time >= '2023-10-01 00:00:00' AND create_time < '2023-10-02 00:00:00';

3. 动态 SQL 拼接与索引选择

• 场景：条件组合随机，无法预建所有联合索引。
• 方法：
◦ 在应用层根据用户输入的条件动态选择最优索引。
◦ 使用 FORCE INDEX 提示强制指定索引（需谨慎）。
• 示例：
sql -- 根据用户输入的条件动态选择索引 SELECT * FROM products FORCE INDEX (idx_category_status) -- 当用户选择 category_id 和 status 时 WHERE category_id = 1 AND status = 1;

4. 利用索引下推（Index Condition Pushdown, ICP）

• 适用数据库：MySQL 5.6+、PostgreSQL 等支持 ICP 的数据库。
• 原理：将 WHERE 条件中索引相关的部分下推到存储引擎层过滤，减少回表次数。
• 示例：
sql -- 联合索引 (a, b) SELECT * FROM table WHERE a > 100 AND b = 200; -- ICP 会先通过索引过滤 a > 100，再在存储引擎层过滤 b = 200。

5. 拆分 OR 条件为 UNION 查询

• 场景：OR 条件导致全表扫描。
• 方法：将 OR 拆分为多个 UNION 子查询，每个子查询走不同索引。
• 示例：
```sql
– 原始低效查询
SELECT * FROM products
WHERE status = 1 OR price < 100;

 -- 优化为 UNION 查询
 SELECT * FROM products WHERE status = 1
 UNION
 SELECT * FROM products WHERE price < 100;
 ```

6. 引入冗余字段或汇总表

• 场景：多条件组合查询频繁且无法建足够索引。
• 方法：
◦ 添加冗余字段（如将 tags 数组拆分为 tag1, tag2 等独立字段）。
◦ 使用物化视图（Materialized View）或汇总表预存高频查询结果。
• 示例：
sql -- 创建商品分类的汇总表 CREATE TABLE product_summary ( category_id INT, avg_price DECIMAL(10,2), total_count INT, PRIMARY KEY (category_id) );

7. 使用全文检索引擎（如 Elasticsearch）

• 场景：多条件筛选 + 模糊搜索（如商品搜索页）。
• 方法：将数据同步到 Elasticsearch，利用倒排索引和组合查询能力。
• 优势：
◦ Elasticsearch 支持动态字段组合查询，无需预建索引。
◦ 通过 filter 和 must 组合条件，性能远高于传统数据库。

8. 业务妥协：限制查询条件范围

• 场景：无法通过技术手段彻底解决性能问题。
• 方法：
◦ 限制用户最多选择 3 个筛选条件。
◦ 对非核心字段（如标签、描述）禁用筛选功能。

三、实战示例：电商商品搜索优化

问题描述

用户可同时按分类、品牌、价格区间、评分、标签等多个字段筛选商品，查询性能差。

优化步骤

分析日志：发现 80% 的查询集中在 分类 + 品牌 + 价格。
建立联合索引：CREATE INDEX idx_category_brand_price ON products(category_id, brand_id, price)。
处理 OR 条件：将标签筛选（tags LIKE '%促销%'）拆分为异步查询或使用 Elasticsearch。
限制范围：价格区间超过数据库处理能力时，返回默认排序结果。
引入缓存：对高频查询结果缓存 5 分钟。

四、总结

动态条件查询的优化核心是 平衡索引覆盖率和查询灵活性：

高频场景：用联合索引覆盖固定条件组合。
低频场景：通过索引下推、UNION 查询、应用层优化减少全表扫描。
终极方案：对复杂查询使用 Elasticsearch 等专用引擎。
业务妥协：适当限制查询条件或引导用户行为。

最终方案需结合数据量、查询模式、数据库类型（如 MySQL 或 PostgreSQL）和业务需求综合选择。

秒杀系统如何设计？

好的，我现在要思考如何设计一个秒杀系统。首先，我需要理解什么是秒杀系统。秒杀通常指的是在极短时间内，大量用户同时抢购少量商品，比如电商平台的限时抢购活动。这种场景下，系统需要应对极高的并发请求，同时保证数据的一致性和系统的稳定性。

接下来，我会回想之前学过的关于高并发系统设计的知识，比如如何应对高流量、防止系统崩溃、保证公平性等。可能需要考虑以下几个方面：

流量削峰：如何应对瞬间的高并发请求，防止服务器过载。常见的方法有队列、缓存、限流等。
库存管理：如何准确扣减库存，避免超卖。可能需要使用数据库的事务、分布式锁或者Redis的原子操作。
系统架构：如何设计系统的各个组件，比如前端、后端、数据库、缓存等，确保各部分的扩展性和高可用性。
防止作弊：如何识别和防止机器人或者刷单行为，比如验证码、用户行为分析等。
用户体验：如何在系统高负载的情况下，仍能提供友好的用户界面和响应，比如排队机制、异步处理等。

现在，我需要逐步分析每个部分的具体实现方法。比如，在流量削峰方面，可以使用消息队列（如Kafka或RabbitMQ）来缓冲请求，让后端处理能力逐步消化请求，而不是直接冲击数据库。库存管理可能需要使用Redis的原子操作（如DECR）来确保库存扣减的原子性，避免超卖。同时，为了应对高并发读取，可以将商品信息提前加载到缓存中，减少数据库的压力。

在系统架构方面，可能需要将秒杀系统独立出来，与主系统隔离，避免秒杀活动影响到其他正常服务。使用负载均衡器（如Nginx）分发请求到多个服务器，提高系统的处理能力。数据库方面，可以考虑分库分表，或者使用高性能的数据库如TiDB来应对高并发写入。

防止作弊方面，可以引入验证码、IP限制、用户行为分析等手段。比如，在用户发起请求前，先进行验证码验证，阻止机器人请求。同时，通过分析用户的请求频率和模式，识别异常行为并进行拦截。

用户体验方面，可以在前端设置排队页面，提示用户等待，而不是直接返回错误。后端采用异步处理方式，用户提交请求后进入队列，处理完成后再通知用户结果。这样即使系统繁忙，用户也能得到明确的反馈，减少焦虑感。

可能遇到的问题包括如何保证Redis和数据库之间的数据一致性，如何处理分布式系统中的锁竞争，以及如何在高并发下进行有效的监控和故障恢复。针对这些问题，需要考虑使用分布式锁（如Redisson）来协调不同节点的操作，使用哨兵模式或集群模式提高Redis的可用性，同时实施全面的监控和告警机制，及时发现和处理系统瓶颈或故障。

最后，需要进行压力测试，模拟高并发场景，验证系统的承载能力和稳定性。通过逐步优化各个环节，确保秒杀系统能够在实际运行中平稳应对高峰流量。

设计一个高并发、高可用的秒杀系统需要从架构设计、流量控制、数据一致性和用户体验等多个维度综合考虑。以下是详细的设计方案，包含核心模块、技术选型及优化策略：

一、秒杀系统核心挑战

瞬时高并发：QPS 可能达到数十万级别。
资源竞争：有限库存被超卖（如 100 个商品被卖出 120 个）。
系统稳定性：避免雪崩效应（如数据库被打挂）。
公平性：防止机器人/黄党抢购。
用户体验：快速响应，避免页面卡顿或白屏。

二、分层架构设计

1. 客户端优化

• 静态资源分离：将商品图片、CSS/JS 等静态资源托管到 CDN。
• 请求合并：前端限制用户频繁点击（如点击后按钮置灰 3 秒）。
• 倒计时校准：前端与服务器同步时间，避免本地时间篡改。
• 预加载策略：活动开始前 5 分钟预加载秒杀页面关键数据（如商品 ID、用户 Token）。

2. 接入层优化

• 负载均衡：使用 Nginx/HAProxy 横向扩展，支持百万级并发连接。
• 限流策略：
◦ IP/用户限流：限制单个用户/IP 的请求频率（如 10 次/秒）。
◦ 令牌桶算法：控制每秒进入系统的请求量。
• 恶意请求拦截：
◦ 人机验证：在关键操作前增加验证码（如滑动拼图）。
◦ 设备指纹：识别异常设备（如模拟器、批量注册账号）。

3. 服务层优化

• 微服务拆分：独立秒杀服务，与主业务隔离（避免资源竞争）。
• 异步化设计：
◦ 请求队列：使用 Kafka/RocketMQ 缓冲请求，削峰填谷。
◦ 结果回调：用户提交请求后进入队列，后端处理完成后通知结果。
• 热点数据缓存：
◦ Redis 集群：缓存商品库存（如 seckill:stock:1001），使用 Lua 脚本保证原子性。
◦ 本地缓存：在服务节点内存中缓存部分库存（需解决一致性问题）。

4. 数据层优化

• 数据库选型：
◦ TiDB：分布式数据库，支持高并发写入。
◦ Redis 持久化：AOF + RDB 保证数据不丢失。
• 库存扣减策略：
◦ 预扣库存：下单时先扣减 Redis 库存，支付成功后再扣减数据库。
◦ 最终一致性：通过异步消息补偿数据库库存。
• 分库分表：按商品 ID 分片，避免单表热点。

三、核心流程设计

1. 秒杀准备阶段

• 预热数据：提前将秒杀商品信息加载到 Redis。
• 库存初始化：在 Redis 中设置库存（如 SET seckill:stock:1001 100）。
• 服务预热：通过压测工具预热 JVM、数据库连接池。

2. 秒杀进行阶段

用户请求 → 接入层（限流、验签） → 服务层（校验库存、生成订单） → 数据层（扣减库存）

• 步骤详解：
1. 用户点击秒杀按钮，携带 Token 和商品 ID 请求服务端。
2. 服务端验证 Token 合法性，检查用户是否重复下单。
3. 通过 Redis Lua 脚本原子性扣减库存：
lua local stock = tonumber(redis.call('GET', KEYS[1])) if stock > 0 then redis.call('DECR', KEYS[1]) return 1 -- 成功 end return 0 -- 失败
4. 库存扣减成功后，发送消息到 MQ，异步生成订单。
5. 订单服务消费 MQ 消息，写入数据库并通知支付系统。

3. 秒杀结束阶段

• 库存回滚：对未支付的订单定时释放库存（如 15 分钟未支付取消）。
• 数据统计：实时计算成交额、UV/PV，展示到大屏。

四、容灾与降级策略

熔断机制：监控服务异常（如 Redis 超时），触发熔断后返回“活动太火爆”提示。
降级方案：
• 读降级：直接返回缓存中的默认商品信息。
• 写降级：关闭非核心功能（如积分抵扣）。
限流兜底：在接入层设置硬限流（如每秒 10 万请求），超出部分直接拒绝。

五、实战优化技巧

Redis 集群部署：
• Proxy 模式：使用 Codis/Twemproxy 分片。
• Cluster 模式：Redis 原生集群，数据自动分片。
Lua 脚本替代事务：避免 WATCH/MULTI 的性能开销。
本地库存缓存：
• 每个服务节点缓存部分库存（如总库存 1000，10 个节点各缓存 100）。
• 风险：可能超卖，需结合全局锁补偿。
队列泄洪：通过线程池控制并发处理数，避免服务线程被打满。

六、监控与告警

核心指标监控：
• 系统层：CPU、内存、网络 IO。
• 中间件：Redis QPS、MQ 堆积量。
• 业务层：库存扣减成功率、订单创建耗时。
全链路追踪：使用 SkyWalking/Jaeger 定位瓶颈。
压测验证：模拟真实流量（如 JMeter 模拟 10 万用户并发）。

七、技术选型参考

组件	推荐方案	替代方案
缓存	Redis Cluster	Codis/Aerospike
消息队列	Kafka	RocketMQ/Pulsar
数据库	TiDB（分布式）	MySQL + 分库分表
限流	Nginx Lua 脚本	Sentinel
监控	Prometheus + Grafana	Zabbix

八、总结

设计秒杀系统的核心原则是 “分层过滤、异步化、最终一致性”：

分层过滤：在客户端、接入层、服务层逐级拦截无效请求。
异步化：通过消息队列解耦核心流程，提升吞吐量。
最终一致性：允许短暂的数据不一致，换取高性能。

最终方案的复杂度取决于业务规模：
• 小型活动（QPS < 1万）：单 Redis + 数据库事务。
• 中型活动（QPS < 10万）：Redis Cluster + MQ + 分库分表。
• 大型活动（QPS > 50万）：全链路异步 + 本地库存 + 分布式数据库。

如何定位&解决线上oom?

如何定位和解决线上 OOM（内存溢出）问题

一、OOM 类型及常见原因

Java Heap Space OOM
• 现象：java.lang.OutOfMemoryError: Java heap space
• 原因：
◦ 内存泄漏（如未释放对象引用）
◦ 数据量激增（如大文件处理、缓存失控）
◦ JVM 堆内存配置过小（-Xmx 设置不合理）
Metaspace (方法区) OOM
• 现象：java.lang.OutOfMemoryError: Metaspace
• 原因：
◦ 动态生成类过多（如频繁使用 CGLib、反射）
◦ -XX:MaxMetaspaceSize 设置过小
Direct Memory OOM
• 现象：java.lang.OutOfMemoryError: Direct buffer memory
• 原因：
◦ 未释放直接内存（如 NIO 的 ByteBuffer 未清理）
◦ -XX:MaxDirectMemorySize 设置过小
其他 OOM 类型
• Unable to create new native thread（线程数过多）
• GC Overhead limit exceeded（GC 耗时过长）

二、定位 OOM 问题的步骤

1. 查看日志和错误堆栈

• 关键信息：
• OOM 类型（如堆、Metaspace）
• 触发 OOM 的代码位置（堆栈中的类和方法）
• 示例日志：

java.lang.OutOfMemoryError: Java heap space  
at com.example.MyService.processData(MyService.java:42)

2. 监控内存使用

• 工具：
• JVM 内置工具：jstat -gc <pid>（GC 统计）、jmap -heap <pid>（堆内存快照）
• 可视化工具：
◦ Arthas：实时监控堆内存、类加载情况
◦ Prometheus + Grafana：长期趋势分析
◦ VisualVM / MAT（Memory Analyzer Tool）：分析 Heap Dump

3. 生成并分析 Heap Dump

• 生成 Heap Dump：
• 自动生成：JVM 参数 -XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=/path/dump.hprof
• 手动生成：
bash # 使用 jmap jmap -dump:format=b,file=/path/dump.hprof <pid> # 使用 Arthas heapdump /path/dump.hprof

• 分析 Heap Dump：
• 工具：MAT、VisualVM、Eclipse Memory Analyzer
• 关键步骤：
1. 查找占用内存最大的对象（Dominator Tree）。
2. 检查是否存在意外的大量对象（如重复字符串、缓存对象）。
3. 追踪对象的 GC Root（查看谁持有这些对象的引用）。

4. 检查代码和资源配置

• 内存泄漏场景：
• 静态集合类（如 static Map）未清理。
• 未关闭资源（如数据库连接、文件流）。
• 监听器或回调未注销。
• 配置检查：
• JVM 堆大小（-Xmx、-Xms）。
• Metaspace 大小（-XX:MaxMetaspaceSize）。
• 直接内存限制（-XX:MaxDirectMemorySize）。

三、解决 OOM 问题的方法

1. 内存泄漏修复

• 示例：静态 Map 未清理

public class Cache {
    private static Map<String, Object> cache = new HashMap<>();
    
    public static void add(String key, Object value) {
        cache.put(key, value);
    }
    
    // 修复：添加清理方法
    public static void remove(String key) {
        cache.remove(key);
    }
}

2. 调整 JVM 参数

• 堆内存不足：增大 -Xmx（如 -Xmx4g）。
• Metaspace 不足：

-XX:MetaspaceSize=256m -XX:MaxMetaspaceSize=512m

• 直接内存不足：

-XX:MaxDirectMemorySize=1g

3. 优化代码逻辑

• 减少对象创建：复用对象（如对象池）。
• 及时释放资源：

try (BufferedReader reader = new BufferedReader(new FileReader("file.txt"))) {
    // 使用 reader
}  // 自动关闭资源

• 限制缓存大小：使用 LRU 策略（如 Guava Cache）：

Cache<String, Object> cache = CacheBuilder.newBuilder()
    .maximumSize(1000)
    .build();

4. 处理直接内存溢出

• 释放 ByteBuffer：

ByteBuffer buffer = ByteBuffer.allocateDirect(1024);
// 手动释放（仅适用于 DirectBuffer）
if (buffer instanceof DirectBuffer) {
    ((DirectBuffer) buffer).cleaner().clean();
}

5. 线程数过多问题

• 优化线程池配置：

ExecutorService executor = Executors.newFixedThreadPool(100);  // 限制最大线程数

• 减少线程栈大小（默认 1MB，可适当降低）：

-Xss256k

四、预防 OOM 的最佳实践

定期压力测试：模拟高并发场景，提前发现内存问题。
监控与告警：
• 设置堆内存使用率超过 80% 时触发告警。
• 监控 Full GC 频率（突然增高可能预示内存泄漏）。
代码审查：
• 避免在循环中创建大对象。
• 谨慎使用静态集合类。
合理配置 JVM 参数：
• 根据系统内存调整 -Xmx 和 -XX:MaxMetaspaceSize。
• 添加 OOM 时自动生成 Heap Dump 参数。

五、案例分析

• 场景：某服务频繁触发 Java heap space OOM。
• 排查步骤：

通过 jstat 发现老年代内存持续增长，Full GC 无效。
分析 Heap Dump，发现某个静态 Map 缓存了用户会话数据且未清理。
• 解决方案：
• 改用 LRU 策略的缓存（如 Guava Cache）。
• 添加定时任务清理过期数据。

总结

定位 OOM 的核心是 快速确定内存溢出类型，通过日志、监控工具和 Heap Dump 分析根源；解决 OOM 需结合代码优化、资源释放和 JVM 调参。预防的关键在于完善监控、定期压测和代码规范。

查看全文

http://www.dtcms.com/a/77182.html

Redis和MongoDB的区别

【数学建模】熵权法

maven插件不能正确解析

八、JavaScript函数

NAT技术-初级总结

MySQL ：参数修改

springboot请求响应

设计一个高性能的分布式限流系统

Redis的消息队列是怎么实现的

HarmonyOS开发，深拷贝、浅拷贝的封装和调用

Spring Boot 核心知识点：依赖注入 (Dependency Injection)

智慧社区2.0

C# 中常见 JSON 处理库的优缺点对比

【设计模式】3W 学习法深入剖析创建型模式：原理、实战与开源框架应用（含 Java 代码）

条款43：学习处理模板化基类内的名称

提示deepseek生成完整的json用于对接外部API

【Film】MovieAgent：自动化电影生成通过多智能体CoT规划

Linux上的`i2c-tools`工具集的详细介绍；并利用它操作IMX6ULL的I2C控制器进而控制芯片AP3216C读取光照值和距离值

深度学习框架PyTorch——从入门到精通（1）下载与安装

flutter 专题一百零三

MySQL如何存储表情符号？

LeetCode 第14~16题

【gopher的java学习笔记】如何知道java应用启动过程中加载了哪些class

【2025 最新 Cursor AI 教程 06】Cursor AI 与其他 AI 编码助手的比较

vue render函数开发高阶组件（HOC）

卷积神经网络 - 卷积的变种、数学性质

【多线程-第四天-SDWebImage介绍-复习前一天的内容 Objective-C语言】

前端使用 crypto-js库AES加解密

2024 年河南省职业院校技能大赛高职组 “大数据分析与应用” 赛项任务书（一）

C语言中，#define和typedef 定义int* 一个容易混淆的点