当前位置：首页 > news >正文

聚簇索引和非聚簇索引

news 2025/10/15 19:28:22

一、什么是聚集索引，二级索引（非聚集索引）

1、聚集索引和非聚集索引概念

分类	含义	特点
聚集索引	将数据存储和索引放到了一块，索引结构的叶子节点保存了整行数据	每张表必须有，且只有一个
非聚集索引	将数据和索引分开存储，索引结构的叶子节点关联的是对应的主键	可以存在多个

聚集索引选取规则：

如果存在主键，主键索引就是聚集索引，如图中的id就是主键索引作为聚集索引
如果不存在主键，将使用第一个唯一（UNIQUE）索引作为聚集索引。
如果这张表没有主键，或没有合适的唯一索引，则InnoDB会自动生成一个rowid作为隐藏的聚集索引

2、聚集索引和非聚集索引的区别

将上表中的主键索引（聚集索引）拿取出来就是：

所有的key（灰色部分）对应的都是表中的主键

叶子节点保存的是整行的数据（row），也就意味着，绿色部分保存的是表中那一整行的数据，我们通过主键就可以直接查询这一行数据

如果给表中的name属性，添加了一个普通索引（二级索引），那么这个索引的数据结构如下：

所有的key（灰色部分）对应的就是name的值

到了叶子节点上，对应存储的就不是整行数据，而是他们所对应的主键的值

3、什么是回表查询

回表查询，也称（二次查询），当我们执行以下sql时：

select * from user where name = 'Arm';

要通过名称，来查询所有字段，name字段上添加了二级索引（非聚集索引），但是这个二级索引上并没有保存这一行所有字段的信息，所以会先通过二级索引查询到叶子结点上的主键的值，再通过主键，使用主键索引（聚集索引）查询整行row数据

这种先使用二级索引查询到聚集索引的主键，再通过主键查询整行数据，使用了两次索引进行查询的SQL，就称为回表查询

二、什么是覆盖索引

覆盖索引是指查询使用了索引，并且需要返回的列，在该索引中已经能全部找到

如图：

第一条SQL，由于是通过主键id去查询的，所以走的肯定是聚集索引，在叶子节点中就保存了所有信息，所以要查询*，所需要的字段是已经有了的，所以是覆盖索引

第二条SQL，通过name查询id和name，首先name作为索引中的key值，肯定是有的，而name创建的二级索引（非聚集索引）的叶子节点上保存的正好是主键id，那么这条SQL需要的所有列，这个索引中都有，也是覆盖索引

第三条SQL，通过name查询id、name、gender字段，其中gender字段既不是索引的key，也不是叶子节点上的主键；则需要通过查询到的id，再使用一次主键的索引（回表查询），才能查询到整行row，才能获取到这个gender值

很显然，能一次性查出来走覆盖索引的，肯定比走回表查询（走两次索引）的，性能要好很多

要怎么尽量避免回表查询呢？

1、尽量不使用select *，用什么字段查什么字段

2、对于经常查询的字段，考虑建立联合索引（多个字段组合当索引的key，如果查这几个字段，就可以使用覆盖索引了）

附一个题目：MySQL超大分页怎么处理呢？

tb_sku表有1千万数据，分页查询tb_sku表中limit 9000000, 10的所有字段

也就是查询第9000000到9000010条数据，如果直接使用

## 11秒
select * from tb_sku limit 9000000, 10;

耗时11秒，因为在进行分页查询时，如果执行limit 9000000,10 ，此时需要MySQL排序前9000010条记录，仅仅返回第9000000到9000010条数据，其他记录丢弃，排序的代价就很大

那么要怎么解决呢？

优化思路：一般分页查询时，通过创建覆盖索引能够比较好地提高性能，可以通过覆盖索引加子查询形式进行优化

如下：

## 7秒左右
select * 
from tb_sku t,
  (select id from tb_sku order by id limit 9000000, 10) a
where t.id = a.id;

如果表tb_sku非常大（如包含数百万或更多记录），推荐使用SQL 2。它通过子查询减少了主查询的扫描范围，避免了直接跳过大量数据，从而提高了查询效率。即使表中有主键索引，SQL 2的性能也通常优于SQL 1。

如果表较小，或者分页查询的偏移量较小（如LIMIT 100, 10），SQL 1的性能也完全可以接受。

查看全文

http://www.dtcms.com/a/21296.html

蓝桥杯 Java B 组之栈的应用（括号匹配、表达式求值）

Python 2 和 Python 3 在字符串编码上的差异

java八股文之Redis

政务浏览器API文档及Demo大升级

uniapp二次封装组件（py组件）

SQL复习

微调codegeex

跟着AI学习vue3第二章

机器视觉--switch语句

基于N-gram模型的中文文本分析系统设计与实现

什么是关系数据库理论？（函数依赖，范式）

轻量级5G核心网：适应未来网络需求的关键方案

【第11章：生成式AI与创意应用—11.2 音频与音乐生成的探索与实践】

C程序设计（第5版）——谭浩强(1)

lazarus 从资源文件中加载PNG图片

【SpringBoot】深度解析 Spring Boot 拦截器：实现统一功能处理的关键路径

跟着李沐老师学习深度学习（十）

LabVIEW开发CANopen的TPDO数据读取

IDEA集成DeepSeek

[特殊字符] 用Rust重塑Web开发速度极限：Hyperlane框架——开启高性能服务的「光年时代」[特殊字符]

模型GPU-＞NPU(Ascend)迁移训练简述

为AI聊天工具添加一个知识系统之106 详细设计之47 Lattice

【第13章：自监督学习与少样本学习—13.2 少样本学习（FSL）与元学习（Meta-Learning）的基础理论与应用案例】

善筹网设计与实现(代码+数据库+LW)

CI/CD(二)docker-compose安装Jenkins

栈的深度解析：从基础实现到高级算法应用——C++实现与实战指南

Java里int和Integer的区别？

【第10章：自然语言处理高级应用—10.4 NLP领域的前沿技术与未来趋势】

基于SpringBoot的医院药房管理系统【源码+答辩PPT++项目部署】高质量论文1-1.5W字

掌握SQLite_轻量级数据库的全面指南

一、什么是聚集索引，二级索引（非聚集索引）

1、聚集索引和非聚集索引概念

2、聚集索引和非聚集索引的区别

3、什么是回表查询

二、什么是覆盖索引

相关文章：