当前位置：首页 > news >正文

MySQL的底层原理--InnoDB数据页结构

news 2025/7/27 12:06:27

上一章节讲述完innodb存储的结构，本章我们则来讲述一下innodb的数据页结构。我们知道innodb每次读取数据则是取出一页进行读取，那么页的结构则是有多个部分组成：文件头部，页头部，页目录，用户记录，空闲空间，文件尾部，页中最大和最小记录。

部分名称	大小（字节）	作用
File Header（文件头）	38	记录页的基本元数据（如页类型、校验值、前后页指针等）
Page Header（页头）	56	记录页的内部管理信息（如记录数量、空闲空间偏移量、索引相关信息等）
Infimum + Supremum	26	页内的虚拟最小 / 最大记录，作为 B+ 树索引的边界哨兵
User Records（用户记录）	动态	实际存储的用户数据记录（或索引记录），大小随数据量变化
Free Space（空闲空间）	动态	页内未使用的空间，用于新记录插入，随记录增删动态变化
Page Directory（页目录）	动态	记录用户记录的偏移量索引，加速页内记录查找（类似 “目录” 功能）
File Trailer（文件尾）	8	用于页的完整性校验（校验和 + LSN），保障数据写入可靠性

下面我们来看看各部分的作用

用户记录&&空闲空间

在一个页中最开始是不会存放数据的，也就是说刚开始一个页中没有用户记录，所有的用户记录都是从空闲空间中分割出去的。

对于空闲空间和用户记录的回收和利用机制如下：

1. 标记删除机制

记录删除时，InnoDB 仅标记 deleted_flag=1，记录头被保留，实际数据未立即清除。
被删除记录的空间加入 PAGE_FREE 指向的空闲链表，供后续插入复用。

2. 空间合并与整理

purge 操作：后台线程定期清理标记删除的记录（purge），合并连续空闲空间，减少碎片。
页分裂 / 合并：当页空间使用率过低（如 <50%），InnoDB 可能触发页合并（将记录迁移至其他页）

页目录

在讲页目录之前，我们首先看一看上一章节所讲述的行记录的头信息字段。

在头信息字段中存放着多个有关行记录的属性

delete_flag：这个主要是用来标记当前记录是否删除，当删除之后则会进入到空闲链表中等待被复用

heap_no：在堆中的编号主要一般编号的大小对应着主键id，用来标识该记录在堆中的位置

next_record：是一个指向下一个行记录的指针

n_owned：则是重头戏，正式因为有了n_owned才会有了页目录的结构

当一个页中的数据过多的时候,我们进行访问的时候则可能需要从头开始访问，那么这样的访问方式往往是低效的，因此设计innodb的人就将一页数据进行分组，当数据为当前最后一组的时候n_owned的值则是当前组的数据个数，因为每个数据进行存放的时候都是按照主键的大小依次存放的，那么我们如果知道这组的最后一位主键大小和n_owned字段就能知道这组数据主键的位置，因此为了更好的查询数据，设计innodb的人则利用了n_owen字段将n_owned字段不为0的数据的地址放置到页目录中的插槽中去，这样页目录则存放着每组最后一个数据的偏移地址，当进行查询的时候采用二分法能快速的查询到想要的地址

Infimum + Supremum

在innodb中的Infimum + Supremum表示着一页的最小记录和最大记录。其中Infimum则会单独分为一组，而Supremum则是存在最后一组一般为6-8个数据。在页生成的时候就会生成Infimum + Supremum这两条记录。

页头

Page Header则是存放着有关页专属的基本信息

字段名称	占用字节	说明
PAGE_N_DIR_SLOTS	2	页目录中存储的槽数量
PAGE_HEAP_TOP	2	未使用的最小空间地址，该地址往后为空闲空间
PAGE_N_HEAP	2	本页中的总记录数（包含正常记录、最大 / 最小记录、已删除记录）
PAGE_FREE	2	第一个已标记为删除的记录地址，已删除记录通过`next_record`形成单链表可复用
PAGE_GARBAGE	2	已删除记录占用的总字节数
PAGE_LAST_INSERT	2	最后插入记录的位置
PAGE_DIRECTION	2	最后一条记录的插入方向（如主键值比上一条大则为 “右边”，反之 “左边”）
PAGE_N_DIRECTION	2	同一方向连续插入的记录数量，方向改变时该值清空
PAGE_N_RECS	2	当前页的业务记录数量（不含最小 / 最大记录、已删除记录）
PAGE_MAX_TRX_ID	8	修改当前页的最大事务 ID，仅在二级索引中定义
PAGE_LEVEL	2	当前页在 B + 树中所处的层级（叶子节点通常为 0，根节点层级最高）
PAGE_INDEX_ID	8	索引 ID，标识当前页所属的索引
PAGE_BTR_SEG_LEAF	10	B + 树叶子段的头部信息，仅在 B + 树的 Root 页中定义
PAGE_BTR_SEG_TOP	10	B + 树非叶子段的头部信息，仅在 B + 树的 Root 页中定义

文件头

文件头则是存放着页的通用信息，也就是说每个页都必须含有的属性

字段名称	占用字节	说明
FIL_PAGE_SPACE	4	页所属的表空间 ID（space id）
FIL_PAGE_OFFSET	4	页号，即页在表空间中的偏移值
FIL_PAGE_PREV	4	当前页的上一页
FIL_PAGE_NEXT	4	当前页的下一页
FIL_PAGE_LSN	8	日志序列号，代表该页最后被修改的日志序列位置
FIL_PAGE_TYPE	2	页类型，如 0x45BF 代表 B + 树叶子节点（存放数据的数据页）
FIL_PAGE_FILE_FLUSH_LSN	8	文件的日志序列号，仅文件的第一页的此字段有效
FIL_PAGE_ARCH_LOG_NO	4	归档日志文件号