当前位置：首页 > news >正文

什么是回表？

news 2025/8/18 9:50:57

在 MySQL 中，回表（Bookmark Lookup） 是当查询无法通过索引直接获取全部所需数据时，需要回到主键索引树二次查询的过程。这是数据库查询性能的关键瓶颈之一，尤其在大型数据表中。

一、回表核心原理图解

示例场景（InnoDB 引擎）

-- 表结构
CREATE TABLE users (id INT PRIMARY KEY,         -- 主键（聚簇索引）name VARCHAR(50),age INT,city VARCHAR(50),INDEX idx_city (city)       -- 二级索引
);-- 查询触发回表
SELECT * FROM users WHERE city = '杭州';

二、回表全流程分析（以 `SELECT *` 为例）

三、回表带来的性能问题

问题类型	原因	影响倍数
I/O 放大	1次二级索引查询 + N次回表（N=符合条件的行数）	10~1000倍
随机磁盘访问	主键值离散 → 聚簇索引物理存储分散 → 磁头频繁寻道	机械硬盘性能下降 100 倍
CPU 开销增加	多次解析索引页 + 数据页	3~5倍

📊 实测数据：百万行表 WHERE city='杭州'（返回 1 万行）

无回表（索引覆盖）：8 ms
有回表：120 ms（SSD）/ 1500 ms（HDD）

四、哪些操作会触发回表？

查询类型	是否回表	原因
`SELECT * FROM ...`	✅	需获取所有字段
`SELECT id, city FROM ...`	❌	索引 `idx_city` 包含所需字段
`SELECT age FROM ...`	✅	`age` 不在二级索引中
`UPDATE ... SET age=30`	✅	需定位完整行数据
`DELETE FROM ...`	✅	需定位完整行数据

五、避免回表的优化方案

方案 1：索引覆盖（Covering Index）

原理：将查询字段全部放入索引

-- 创建覆盖索引
ALTER TABLE users ADD INDEX idx_city_age_name(city, age, name);-- 优化后查询（不再回表）
SELECT city, age, name FROM users WHERE city = '杭州';

执行计划：Extra: Using index

方案 2：强制使用主键

适用场景：主键查询

-- 直接走聚簇索引（无回表）
SELECT * FROM users WHERE id = 101;

方案 3：索引下推（ICP）

原理：在存储引擎层提前过滤数据，减少回表行数（MySQL 5.6+）

-- 索引 (city, age)
SELECT * FROM users 
WHERE city = '杭州' AND age > 30; -- ICP在引擎层过滤age

执行计划：Extra: Using index condition

方案 4：使用聚簇索引

-- 将常用查询列设为主键（谨慎！）
ALTER TABLE users DROP PRIMARY KEY,
ADD PRIMARY KEY (city, id);

六、回表 vs 索引覆盖性能对比

# 测试表：100万行 users 数据
# 索引：idx_city (city)-- 场景1：回表查询（需0.9秒）
SELECT * FROM users WHERE city='杭州'; -- 场景2：索引覆盖（仅0.02秒）
SELECT city, id FROM users WHERE city='杭州';

指标	回表查询	索引覆盖	提升倍数
执行时间	920 ms	22 ms	41x
磁盘 I/O 次数	10,000+	10	1000x
Buffer Pool 冲击	高	低	-

七、高级技巧：覆盖索引优化 JOIN

-- 订单表 orders
CREATE TABLE orders (id INT PRIMARY KEY,user_id INT,amount DECIMAL(10,2),INDEX idx_user_id (user_id)
);-- 优化前（回表）
EXPLAIN SELECT * FROM orders 
WHERE user_id IN (SELECT id FROM users WHERE city='杭州');-- 优化后（覆盖索引避免回表）
ALTER TABLE orders ADD INDEX idx_user_amount(user_id, amount);EXPLAIN SELECT user_id, amount FROM orders 
WHERE user_id IN (SELECT id FROM users WHERE city='杭州');

八、如何识别回表现象？

1. 查看执行计划

EXPLAIN SELECT * FROM users WHERE city='杭州';

回表标志：type=ref + Extra=NULL
覆盖索引标志：Extra=Using index

2. 监控性能

-- 查看回表导致的读操作
SHOW STATUS LIKE 'Handler_read%';

Handler_read_rnd_next 值高 → 回表严重
Handler_read_key 值低 → 索引未有效利用

总结：回表优化黄金法则

严禁 SELECT * → 只取必要字段
高频查询必须走覆盖索引 → 包含 WHERE + SELECT 字段
长字段用前缀索引 → ALTER TABLE t ADD INDEX idx (col(10))
定期优化索引 → OPTIMIZE TABLE 减少碎片
冷热数据分离 → 大字段拆分到扩展表

通过合理设计索引避免回表，可使查询速度提升 10~100 倍，这是 MySQL 性能优化最核心的实践之一。

什么是索引覆盖与索引下推？
什么是聚簇索引和非聚簇索引？

查看全文

http://www.dtcms.com/a/336329.html

如何解决pip安装报错ModuleNotFoundError: No module named ‘scikit-image’问题

Hooks useState的使用

leetcode热题100——day33

视频内容提取与AI总结：提升学习效率的实用方法

【深度学习新浪潮】近三年图像处理领域无监督学习的研究进展一览

科目二的四个电路

《Vuejs设计与实现》第 14 章（内建组件和模块）

概率dp|math

Android中切换语言的方法

基于Netty的高并发WebSocket连接管理与性能优化实践指南

ReactNode 类型

第12章《学以致用》—PowerShell 自学闭环与实战笔记

“让机器人更智慧让具身体更智能”北京世界机器人大会行业洞察

Python 调试工具的高级用法

OJ目录饿

Python 基础语法（二）

Kubernetes存储迁移实战：从NFS到阿里云NAS完整指南

【踩坑笔记】50系显卡适配的 PyTorch 安装

XF 306-2025 阻燃耐火电线电缆检测

JavaScript 性能优化实战：从评估到落地的全链路指南

Docker Compose 安装 Neo4j 的详细步骤

福彩双色球第2025094期号码分析

Jenkins - CICD 注入环境变量避免明文密码暴露

用MTEB对Embedding模型进行benchmark

Pell数列

基本的设计原则

SONiC (4) - redis的介绍以及应用

远程协作绘图：借助 cpolar 内网穿透服务访问 Excalidraw

用PaddleDetection套件训练自己的数据集，PP-YOLO-SOD训练全流程

领域快速入门过程记录之--电力网络