当前位置：首页 > news >正文

Mysql 笔记

news 2025/7/14 8:55:33

不管是二叉搜索树还是多路搜索树，只要是搜索树，那么节点的关键字必须是可以通过某种方式进行大小比较的

一，选择B+Tree的原因

1.常用的搜索二叉树的，平衡二叉树，红黑树等，由于每个节点只能存放一个索引关键字，如果数据量比较大的话，就会导致树的高度很高，这样在查询的过程中就有可能需要多次从磁盘加载索引的文件的中的节点数据，每次加载都需要进行IO操作，导致查询性能比较低

2.B-Tree 是一种平衡多路搜索树，每个节点可以存储多个索引关键字，一个父节点可以有多个子节点(大于2个)，一个N阶B-Tree每一个节点最多包含N-1个索引关键字，最多有N个子节点，这样本来是可以大大降低搜索树的高度，但是由于B-Tree的非叶子节点中除了索引关键字，还包含这些关键字所对应的行数据，这样在每个节点的存储大小固定的情况下，如果每一行的数据很大的话，就会导致每个节点包含的索引关键字变少，同样也有可能会使得树的高度比较高。B-Tree对范围查询范围查找的支持也不是太好

3.B+Tree是在B-Tree基础上进行优化得来的一种多路搜索树，B+Tree的非叶子节点上仅存储索引关键字（组合索引存储多个字段的值），不存储数据，数据只存储在叶子节点上，并且数据是按照顺序拍列的。B+Tree包含数据的叶子节点之间是通过双向列表连接的，而且是按照大小顺序连接的，支持正向（next）和反向（prev）查询，例如 ORDER BY Key DESC。非叶子节点不存放数据，只存放索引关键字，这样相同存储容量的非叶子节点，可以存储更多的索引关键字，也可以有更多的子节点，所以树的高度也可以降低

1. 非叶子节点的结构

存储内容：
- 一组有序的索引键（K1, K2, ..., Km-1）。
- m 个子节点指针（P0, P1, ..., Pm），其中：
- P0 指向所有键 < K1 的子树。
- P1 指向 K1 ≤ Key < K2 的子树。
- ...
- Pm 指向所有键 ≥ Km-1 的子树。
存储的结构
- 非叶子节点
- [P0] [K1=10] [P1] [K2=20] [P2] [K3=30] [P3]
- 若查找 Key=15，会进入 P1 指向的子树（因为 10 ≤ 15 < 20）。

2. 从非叶子节点定位到叶子节点的步骤

(1) 初始查找（根节点）

从根节点开始，通过二分查找定位目标Key所在的子节点指针。
- 若根节点是叶子节点（B+树高度为1），直接返回数据。
- 否则，找到第一个 ≥ 目标Key的索引键，选择其左侧的子节点指针。

(2) 递归向下搜索

对选中的子节点（可能是非叶子节点或叶子节点）重复以下操作：
1. 判断节点类型：
  - 如果是非叶子节点：继续二分查找，定位下一个子节点指针。
  - 如果是叶子节点：停止搜索，从叶子节点中提取数据（或确认数据不存在）。
2. 移动到子节点：根据选中的指针访问下一层节点。

(3) 终止条件

到达叶子节点时，叶子节点可能包含：
- 实际数据（如数据库记录）。
- 指向数据的指针（如主键、行地址等）。
- 若未找到目标Key，则说明数据不存在。

[Root: P1(K=10), P2(K=20), P3]
/ | \
[P1: K=5] [P2: K=15] [P3: K=25] (假设非叶子节点)
/ \ / \ / \
[L1] [L2] [L3] [L4] [L5] [L6]

查找 Key=15：
1. 根节点：10 ≤ 15 < 20 → 选择 P2。
2. P2 节点：键为 15，其 P1 指向 L3（假设 P1 是左子指针，P2 是右子指针）。
3. 进入 L3（叶子节点），查找 Key=15 的记录。
查找逻辑：
1. 目标Key K 在非叶子节点中匹配时，不会直接返回数据，而是根据 K 的位置选择子节点指针，继续向下搜索。