LSM树与B+树优缺点分析
1. LSM树优化了顺序写,因此写性能很好,但在查询上: 需要从Level 0到Level n一直顺序查下去。极端情况是LSM树中不存在该数据,则需要遍历L0->Ln,最后返回空集。
解决方法是用布隆过滤器优化查询。
2. B+树范围查询性能很好,缺点包括:
- 随机写的性能差:B+树每次插入或更新操作可能需要访问不同的叶子节点,导致每次写操作都需要随机读写。
- 更新操作的代价高:每次更新操作都需要修改索引树,可能会触发写锁,阻塞数据查询操作,尤其是在并发写的情况下,性能会更差。
- 占用空间大:B+树索引结构会占用较多的存储空间,尤其是在数据库增大时,这种占用会更加显著
以下几种情况可能表现不佳:
- 高并发下的分裂合并 2.更新 3.树比较深的时候 4. 数据分布不均匀:可能会导致某些分支的节点过于密集,而其他分支则比较稀疏。
总结:B+树读快写慢, LSM树写快读慢(所以HBase用布隆过滤器弥补读问题),两者适用场景互补。
参考: https://zhuanlan.zhihu.com/p/415799237