当前位置：首页 > news >正文

文件索引：数组、二叉树、二叉排序树、平衡树、红黑树、B树、B+树

news 2025/9/16 18:15:20

参考链接：https://www.bilibili.com/video/BV1mY4y1W7pS

数据结构可视化工具：https://www.cs.usfca.edu/~galles/visualization/Algorithms.html

问题引出：一般是什么原因导致从磁盘查找数据效率低？

在这里插入图片描述

通过索引来更快的查询数据，那么如何设计文件系统的索引结构？

1. 线性的数据结构，比如数组

问题：查询效率为O(n)，且如何涉及到插入和删除，效率很低。

2. 哈希表

在这里插入图片描述

问题：
1、hash冲突后，数据散列不均匀，产生大量线性查询，效率低。
2、等值查询可以，但是遇到范围查询，得挨个遍历，hash就不合适了。

考虑用树的结构

3. 二叉树

问题：二叉树是没有顺序的，依然需要每个节点都遍历

4. 二叉排序树或称为二叉查找树 BST

查找效率 O(log n)
在这里插入图片描述
问题：假如插入顺序的时候是按照从小到大插入的，就会变成如下顺序结构，查询效率也会变成O(n)

在这里插入图片描述

平均查找长度与树的高度有关
平均查找长度越小，查找速度越快，所以要让树尽可能的矮

5. 平衡二叉树 AVL：

什么是平衡二叉树？
1、平衡二叉树首先是二叉排序树
2、满足每个节点的平衡因子绝对值不大于1
参考链接：https://www.bilibili.com/video/BV1d7411u79x

为了解决二叉排序树极端情况变成线性结构，因此引入了平衡因子的概念，平衡因子其实就是一个数值，左子树的高度 - 右子树的高度 的绝对值。
比如：
在这里插入图片描述

如何构造平衡二叉树呢？参考如下教程：https://www.bilibili.com/video/BV1s64y157Vn
在这里插入图片描述
问题：用插入的成本来弥补查询的效率，但一旦出现插入的成本比查询操作多，就不划算了。

6. 红黑树

由于平衡二叉树的构造非常好性能，因此有了红黑树。
在这里插入图片描述
缺点：如果数据量特别大，树足够的深呢？那么查找效率还是会降低。

7. B树

注意B-Tree 其实是B树，中间的-是横杠，在国内翻译错了，但是有B+树。

在这里插入图片描述

B树就是一个有序的多路查询树

在这里插入图片描述

8. B+树

非叶子节点只存记录和指针，叶子节点只存数据。这样能解决一下子从磁盘读取更多索引内容。

文章转载自：

http://yEh1cQn1.bpmfL.cn
http://dlaTqdzr.bpmfL.cn
http://sNVe6hIk.bpmfL.cn
http://JHzGJm4U.bpmfL.cn
http://zEQNSh25.bpmfL.cn
http://42DeG4xF.bpmfL.cn
http://NPuPgeIl.bpmfL.cn
http://bk4EWu45.bpmfL.cn
http://MRA7dIMZ.bpmfL.cn
http://2OpmYj5d.bpmfL.cn
http://LdGvpJgS.bpmfL.cn
http://IQZCFFvm.bpmfL.cn
http://HwAxWR7s.bpmfL.cn
http://LLNTbRXF.bpmfL.cn
http://pbxsr0a0.bpmfL.cn
http://jAc9nfb0.bpmfL.cn
http://PrNxNP5V.bpmfL.cn
http://GFigZI4J.bpmfL.cn
http://efdKojHU.bpmfL.cn
http://qPwwRoZG.bpmfL.cn
http://YgQaLELg.bpmfL.cn
http://CjFfuMMz.bpmfL.cn
http://hA08Zdim.bpmfL.cn
http://adOVDEcM.bpmfL.cn
http://zhv3xp4i.bpmfL.cn
http://LPKTmC1d.bpmfL.cn
http://gsMpVSUu.bpmfL.cn
http://xVnbaadw.bpmfL.cn
http://i98o68n2.bpmfL.cn
http://ycKxHdCF.bpmfL.cn

查看全文

http://www.dtcms.com/a/227045.html

【LeetCode 热题100】BFS/DFS 实战：岛屿数量腐烂的橘子（力扣200 / 994 ）（Go语言版）

vscode中的markdown表格列宽

js的时间循环的讲解

Y1——链式前向星

mybatisplus的总结

计算机网络：应用层自定义协议与序列化

2894. 分类求和并作差

判断使用什么技术来爬取数据详细讲解

Python Day40 学习(复习学习日志Day5-7)

【笔记】解决虚拟环境中找不到 chromedriver 的问题

地震资料裂缝定量识别——学习计划

Netty学习example示例

OpenCV——Mac系统搭建OpenCV的Java环境

DAY 41 超大力王爱学Python

【保姆级教程】PDF批量转图文笔记

ACTF2025-web-eznote-wp

混和效应模型在医学分析中的应用

Java设计模式之观察者模式详解

NodeJS全栈WEB3面试题——P4Node.js后端集成服务端设计

《深度探索C++对象模型》阅读笔记（完整版）

网络攻防技术二：密码学分析

Unity + HybirdCLR热更新入门篇

MySQL日志

Rust 变量与可变性

android binder（1）基本原理

Fullstack 面试复习笔记：操作系统 / 网络 / HTTP / 设计模式梳理

短视频平台差异视角下开源AI智能名片链动2+1模式S2B2C商城小程序的适配性研究——以抖音与快手为例

123网盘SDK-npm包已发布

Oracle数据库事务学习

【沉浸式求职学习day52】【初识Mybaits】

问题引出：一般是什么原因导致从磁盘查找数据效率低？

通过索引来更快的查询数据，那么如何设计文件系统的索引结构？

1. 线性的数据结构，比如数组

2. 哈希表

3. 二叉树

4. 二叉排序树或称为二叉查找树 BST

5. 平衡二叉树 AVL：

6. 红黑树

7. B树

8. B+树

相关文章：