当前位置：首页 > news >正文

关于B+树的介绍

news 2025/9/13 21:30:16

1、B+树和N叉树

1.1、B+树的基本定义

1.2、B+树与N叉树的关系

1、N叉树

2、B+树的节点结构

1.3、B+树的N叉特性

1、阶数决定N的值

2、B+树的N叉特性

3、B+树被称为N叉树原因

4、阶数和性能的影响编辑

1.4、B+树与B树的区别

2、B+树的查找元素

3、B+树的插入元素

4、实际应用

4.1、Innodb引擎

4.2、文件系统

前言

B+树是一种优化的B树结构，适用于数据库索引。它保证所有数据都在叶子节点，且叶子节点间有链接，便于数据检索。

数据结构如下所示：

1、B+树和N叉树

1.1、B+树的基本定义

B+树 是一种 平衡的多叉搜索树，广泛应用于数据库和文件系统的索引结构（如MySQL的InnoDB存储引擎）。

核心特点

每个节点可以包含多个子节点（即 N叉树）。

所有叶子节点通过指针连接，形成一个有序链表。

内部节点仅存储键值，数据（记录指针）仅存在于叶子节点。

1.2、B+树与N叉树的关系

1、N叉树

N叉树 是指每个节点最多有 NN 个子节点的树结构。
- 二叉树：每个节点最多有 2 个子节点（N=2）。
- 三叉树：每个节点最多有 3 个子节点（N=3）。
- B+树：每个节点最多有 mm 个子节点（N=m，其中 mm 是 B+树的阶数）。

2、B+树的节点结构

B+树的节点分为 内部节点 和 叶子节点。

1、内部节点（非叶子节点）：

存储键值（Key）和 子节点指针。每个节点最多有 mm 个子节点（N=m）。

2、叶子节点：

存储键值和 数据指针（或实际数据）。所有叶子节点通过指针 双向连接，形成有序链表。

1.3、B+树的N叉特性

1、阶数决定N的值

阶数 m 是 B+树的核心参数，表示：
- 每个节点最多有 m 个子节点。
- 每个节点最多存储 m−1个键值。

示例：

对于阶数 m=5的 B+树：每个节点最多有 5 个子节点（N=5）。每个节点最多存储 4 个键值。

2、B+树的N叉特性

每个节点的子节点数量可变：

内部节点的子节点数在 ⌈m/2⌉ 到 m 之间（保持树的平衡）。

叶子节点的子节点数为 0（无子节点）。

3、B+树被称为N叉树原因

直接原因：B+树的每个节点最多有 mm 个子节点（N=m），符合N叉树的定义。
根本原因：
- 多路平衡：B+树通过多路分支（N叉）减少树的高度，提高磁盘IO效率。
- 阶数 mm：B+树的性能与 mm 直接相关，mm 越大，树越矮，查找路径越短。

示例：阶数 m=3 的 B+树

        [10, 20]              // 内部节点（2个键值，3个子节点）/     |     \
[5, 8]      [15]      [25, 30] // 叶子节点（存储数据）

内部节点：存储键值 10、20，指向 3 个子节点。
叶子节点：存储数据（如记录指针），并通过指针连接。

4、阶数和性能的影响

1.4、B+树与B树的区别

如下所示：

⚠️注意：

B+树是 N叉树 的一种，其阶数 mm 决定了每个节点的最大子节点数（N=m）。这种多叉结构是B+树在数据库和文件系统中广泛应用的核心原因。

2、B+树的查找元素

B+树中的所有数据均保存在叶子结点，且根结点和内部结点均只是充当控制查找记录的媒介，并不代表数据本身，所有的内部结点元素都同时存在于子结点中，是子节点元素中是最大（或最小）元素。

如下图所示：

例如B+树中查找55这个关键字，步骤如下：

1、在根节点中对比55和根节点中的元素[60, 85]，发现55<60，因此应该在第一个结点中继续寻找；
2、比较55和第一个节点中的元素[10, 20, 50, 60]，发现50<55<60，因此55应该存在于第四个结点当中；
3、继续对比55和第四个结点中的元素[55, 60]，找到55，查找成功。当然，也有查找失败的情况，即要查找的元素并不在B+树中。

3、B+树的插入元素

其插入规则如下：

1、插入的操作全部都在叶子结点上进行，且不能破坏关键字自小而大的顺序；
2、当插入关键字后结点的关键字个数大于m，需要进行“分裂”。

B+树的插入有四种情况：

1、若被插入关键字所在的结点，其含有关键字数目小于m，则直接插入；

2、若被插入关键字所在的结点，其含有关键字数目等于m，则需要将这个结点分为左右两部分，中间的结点放到父节点中。假设其双亲结点中包含的关键字个数小于 m，则插入操作完成。

3、在第 2 种情况中，如果上移操作导致其双亲结点中关键字个数大于 M，则应继续分裂其双亲结点。

4、若插入的关键字比当前结点中的最大值还大，破坏了B+树中从根结点到当前结点的所有索引值，此时需要及时根节点、字节点，再做叶子节点插入操作。

举例：