当前位置：首页 > news >正文

java面试Day1 | redis缓存穿透、击穿、雪崩、持久化、双写一致性、数据过期策略、数据淘汰策略、分布式锁、redis集群

news 2025/9/18 7:41:44

应届生如何找到合适的练手项目

面试形式

Redis篇

redis使用场景-缓存-缓存穿透

补充知识：布隆过滤器

1. 初始化

2. 插入元素（以元素 “Apple” 为例）

3. 查询元素（判断 “Banana” 是否在集合中）

redis使用场景-缓存-缓存击穿

redis使用场景-缓存-缓存雪崩

redis使用场景-缓存-双写一致性

情况一：分布式锁/读写锁：保证数据强一致性，但性能低

情况二：允许延迟一致/保证数据的最终一致性

redis使用场景-缓存-持久化

RDB数据快照

AOF追加文件

redis使用场景-缓存-数据过期策略

1. 惰性删除

2. 定期删除

redis使用场景-缓存-数据淘汰策略

redis分布式锁-使用场景

redis分布式锁-实现原理（setnx、redission）

1. setnx

2. redisson

redisson实现的分布式锁--可重入

redisson实现的锁--主从一致性

redis其他面试问题--主从复制、主从同步流程

1. 主从复制：解决高并发问题，缺点是不能保证高可用

2. 哨兵模式、集群脑裂：哨兵模式解决高可用问题

3. 分片集群结构：解决海量数据、高并发写的问题

redis其他面试题：redis是单线程的，为什么还这么快？

应届生如何找到合适的练手项目

参考多个项目深挖某一个功能的实现

面试形式

多查看招聘网站

Redis篇

redis使用场景-缓存-缓存穿透

补充知识：布隆过滤器

布隆过滤器的本质是一个二进制数组（bit array） + 多个哈希函数（Hash Function），核心逻辑分两步：插入元素和查询元素。

1. 初始化

先创建一个长度为 m 的二进制数组（初始时所有位都设为 0），并选定 k 个独立的哈希函数（哈希函数需满足 “均匀分布”，避免哈希碰撞集中）。
例：假设 m=10，k=2，初始数组为 [0,0,0,0,0,0,0,0,0,0]。

2. 插入元素（以元素 “Apple” 为例）

对插入的元素，用 k 个哈希函数分别计算出 k 个哈希值，再将这些哈希值对数组长度 m 取模，得到 k 个 “数组下标”，最后将数组中这些下标的值从 0 改为 1。

例：用哈希函数 1 计算 “Apple” 得哈希值 15，15 mod 10 = 5 → 下标 5 设为 1；
用哈希函数 2 计算 “Apple” 得哈希值 23，23 mod 10 = 3 → 下标 3 设为 1；
插入后数组变为 [0,0,0,1,0,1,0,0,0,0]。

3. 查询元素（判断 “Banana” 是否在集合中）

对查询的元素，同样用 k 个哈希函数计算 k 个下标，然后检查数组中这些下标的值：

若所有下标都是 1：元素 “可能存在”（存在假阳性）；
若有任意一个下标是 0：元素 “绝对不存在”（无假阴性）。
例：查询 “Banana”，哈希后得到下标 2 和 7，数组中这两个位置都是 0 → 判定 “Banana 绝对不在集合中”；
若查询某个元素，哈希后得到下标 3 和 5（均为 1）→ 判定 “该元素可能在集合中”（无法 100% 确定，因为其他元素的哈希也可能覆盖这两个位置）。

特性	说明
空间效率极高	仅用二进制位存储，无需存储元素本身。例如，存储 100 万条数据，仅需约 1MB 内存（传统集合需数十 MB）。
查询速度极快	仅需执行 `k` 次哈希计算和数组访问，时间复杂度为 O(k)（`k` 通常是个位数，如 3-5）。
无假阴性	只要元素确实在集合中，查询结果一定是 “存在”，不会漏判。
有假阳性	元素不在集合中时，可能因哈希碰撞被误判为 “存在”，假阳性率可通过参数调节。
不支持删除元素	二进制位是 “共享” 的（一个位可能被多个元素标记），删除一个元素会导致其他元素的标记被破坏，进而引发假阴性。

假阳性率（False Positive Rate, FPR）是布隆过滤器的核心指标，主要由三个参数决定：

m：二进制数组的长度（越长，FPR 越低）；
k：哈希函数的个数（过少会导致碰撞多，过多会增加查询时间和 FPR）；
n：集合中实际存储的元素数量（越多，FPR 越高）

通过数学公式可计算理论假阳性率：
FPR ≈ (1 - e^(-kn/m))^k

实际应用中，通常会根据需求先确定 n 和可接受的 FPR，再反推 m 和 k 的最优值。例如：

若需存储 n=100万 条数据，接受 FPR=0.1%，则最优 m≈140万位（约 170KB），k=10。

布隆过滤器的特性使其特别适合 “过滤不存在的元素”，减少后续高成本操作，常见场景包括：

缓存穿透防护（最经典场景）
缓存穿透：用户请求不存在的数据（如查询 ID=-1 的用户），导致请求直接穿透缓存，冲击数
解决方案：将数据库中所有存在的 ID 存入布隆过滤器，据库。请求先经过过滤器 —— 若判定 “不存在”，直接返回空结果；若判定 “可能存在”，再查缓存和数据库，避免无效数据库查询。
分布式系统去重
例如：分布式爬虫去重（判断 URL 是否已爬取）、消息队列去重（判断消息 ID 是否已消费）—— 无需在多个节点间同步完整数据集，仅需共享布隆过滤器即可快速去重。
LevelDB/RocksDB 等数据库
这类嵌入式数据库的底层用布隆过滤器优化 “不存在 key 的查询”：先查布隆过滤器，若判定 “不存在”，直接返回，无需读取磁盘（磁盘 IO 成本远高于内存查询）。
黑名单校验
例如：垃圾邮件过滤（校验发件人邮箱是否在黑名单）、IP 黑名单（拦截恶意 IP）—— 无需存储完整黑名单，仅用布隆过滤器快速过滤，再对 “可能存在” 的情况做二次校验（降低假阳性影响）。