当前位置：首页 > news >正文

MySQL 索引详解：从基础到原理

news 来源：原创 2025/5/31 22:54:22

MySQL 索引详解：从基础到原理

引言

在使用 MySQL 数据库时，索引是提高查询性能的关键因素之一。合理的索引设计可以将查询效率提升几个数量级，而不合理的索引则可能导致数据库性能下降。本文将深入探讨 MySQL 索引的核心概念、常见类型、底层数据结构及其优化策略，并结合具体 SQL 样例进行分析。

一、索引概述

1.1 什么是索引？

索引是一种特殊的数据结构，它存储了表中一列或多列的值，并按照特定的算法进行排序。索引就像是一本书的目录，可以帮助数据库快速定位到需要的数据，而不必逐行扫描整个表。

1.2 索引的作用

提高查询速度：通过索引可以快速定位到符合条件的数据行，减少磁盘 I/O。
加速排序：索引通常已经排好序，可以避免额外的排序操作。
保证数据唯一性：唯一索引可以确保列中没有重复值。
优化连接查询：在多表连接时，索引可以快速定位到关联表中的数据。

1.3 索引的代价

存储空间：索引需要占用额外的磁盘空间。
写入性能：每次插入、更新或删除数据时，都需要更新相应的索引，会降低写入性能。
维护成本：索引需要定期维护（如重建、分析），以保证其效率。

二、MySQL 索引类型

MySQL 支持多种索引类型，不同的索引适用于不同的场景。以下是常见的索引类型及其特点：

2.1 普通索引（INDEX）

特性：

最基本的索引类型
没有任何限制
加速查询

SQL 样例：

-- 创建普通索引
CREATE INDEX idx_name ON users (name);-- 在创建表时定义索引
CREATE TABLE users (id INT PRIMARY KEY,name VARCHAR(50),age INT,INDEX idx_age (age)
);-- 修改表结构添加索引
ALTER TABLE users ADD INDEX idx_age (age);

2.2 唯一索引（UNIQUE）

特性：

确保索引列中的值唯一
允许 NULL 值（但每个 NULL 值被视为唯一）
加速查询

SQL 样例：

-- 创建唯一索引
CREATE UNIQUE INDEX idx_email ON users (email);-- 在创建表时定义唯一索引
CREATE TABLE users (id INT PRIMARY KEY,name VARCHAR(50),email VARCHAR(100) UNIQUE
);-- 修改表结构添加唯一索引
ALTER TABLE users ADD UNIQUE INDEX idx_email (email);

2.3 主键索引（PRIMARY KEY）

特性：

是一种特殊的唯一索引
不允许 NULL 值
每个表只能有一个主键
通常是表的逻辑标识

SQL 样例：

-- 在创建表时定义主键
CREATE TABLE users (id INT PRIMARY KEY AUTO_INCREMENT,name VARCHAR(50)
);-- 修改表结构添加主键
ALTER TABLE users ADD PRIMARY KEY (id);

2.4 复合索引（联合索引）

特性：

基于多个列创建的索引
遵循最左前缀原则
可以加速多个列的查询条件

SQL 样例：

-- 创建复合索引
CREATE INDEX idx_name_age ON users (name, age);-- 最左前缀原则示例
SELECT * FROM users WHERE name = 'John';  -- 有效使用索引
SELECT * FROM users WHERE age = 30;       -- 无法使用索引
SELECT * FROM users WHERE name = 'John' AND age = 30;  -- 有效使用索引

2.5 全文索引（FULLTEXT）

特性：

用于全文搜索
支持自然语言搜索和布尔搜索
适用于 TEXT 和 VARCHAR 类型的列

SQL 样例：

-- 创建全文索引
CREATE FULLTEXT INDEX idx_content ON articles (content);-- 全文搜索示例
SELECT * FROM articles WHERE MATCH(content) AGAINST('MySQL索引' IN NATURAL LANGUAGE MODE);

2.6 空间索引（SPATIAL）

特性：

用于地理空间数据
支持 GEOMETRY、POINT、LINESTRING、POLYGON 等类型
加速空间查询

SQL 样例：

-- 创建空间索引
CREATE SPATIAL INDEX idx_location ON stores (location);-- 空间查询示例
SELECT * FROM stores WHERE ST_DISTANCE(location, POINT(116.40, 39.90)) < 1000;

三、MySQL 索引底层数据结构解析

3.1 B-Tree 与 B+Tree 索引

大多数 MySQL 存储引擎（如 InnoDB、MyISAM）使用 B+Tree 作为索引结构：

B-Tree 结构特点：

每个节点可以包含多个键值和子节点
键值有序排列
叶子节点和非叶子节点都存储数据
适用于范围查询

B+Tree 结构特点：

所有数据都存储在叶子节点
非叶子节点只存储索引键和指针
叶子节点之间通过指针相连，形成有序链表
更适合范围查询和磁盘存储

B+Tree 索引的优势：

磁盘读写代价更低：非叶子节点不存储数据，节点可以容纳更多的键值，减少树的高度。
查询效率更稳定：所有查询都要找到叶子节点，查询效率相当。
更适合范围查询：叶子节点的有序链表结构支持范围查询。

3.2 InnoDB 中的聚簇索引与辅助索引

聚簇索引（Clustered Index）：

InnoDB 使用聚簇索引存储数据
主键索引的叶子节点直接包含行数据
一张表只能有一个聚簇索引

+--------+          +--------+          +--------+
| 主键1  |---------->| 主键2  |---------->| 主键3  |
+--------+          +--------+          +--------+
| 数据行 |          | 数据行 |          | 数据行 |
+--------+          +--------+          +--------+

辅助索引（Secondary Index）：

非主键索引称为辅助索引
辅助索引的叶子节点存储主键值，而不是行数据的物理地址
查询时需要二次查找（先查辅助索引，再通过主键查聚簇索引）

+--------+          +--------+          +--------+
| 索引键1|---------->| 索引键2|---------->| 索引键3|
+--------+          +--------+          +--------+
| 主键值 |          | 主键值 |          | 主键值 |
+--------+          +--------+          +--------+

3.3 MyISAM 中的索引与数据存储

MyISAM 使用非聚簇索引，索引和数据是分离的：

.frm：表结构定义文件
.MYD：数据文件（Data File）
.MYI：索引文件（Index File）

MyISAM 的索引文件只存储索引键和数据行的物理地址：

+--------+          +--------+          +--------+
| 索引键1|---------->| 索引键2|---------->| 索引键3|
+--------+          +--------+          +--------+
| 物理地址|          | 物理地址|          | 物理地址|
+--------+          +--------+          +--------+

3.4 哈希索引

Memory 引擎支持哈希索引：

特性：

基于哈希表实现
查找速度极快（O (1) 时间复杂度）
只支持精确匹配，不支持范围查询
不支持部分索引列匹配（如复合索引的最左前缀）

-- 创建哈希索引
CREATE TABLE users (id INT,name VARCHAR(50),INDEX USING HASH (name)
) ENGINE=MEMORY;

四、MySQL 索引优化策略

4.1 最左前缀原则

复合索引遵循最左前缀原则，即查询条件必须从索引的最左边列开始，否则无法使用索引。

示例：

-- 创建复合索引 (a, b, c)
CREATE INDEX idx_abc ON table_name (a, b, c);-- 有效使用索引的查询
SELECT * FROM table_name WHERE a = 1 AND b = 2 AND c = 3;
SELECT * FROM table_name WHERE a = 1 AND b = 2;
SELECT * FROM table_name WHERE a = 1;-- 无法使用索引的查询
SELECT * FROM table_name WHERE b = 2;
SELECT * FROM table_name WHERE c = 3;
SELECT * FROM table_name WHERE b = 2 AND c = 3;

4.2 索引选择性与基数

索引选择性：指索引列中不同值的数量与总行数的比值，选择性越高，索引效率越好。

索引基数：指索引列中不同值的数量。

-- 查看索引基数
SHOW INDEX FROM table_name;-- 优化低选择性的索引
ALTER TABLE table_name ADD INDEX idx_status (status);  -- 低选择性（如ENUM类型）
ALTER TABLE table_name ADD INDEX idx_email (email);    -- 高选择性

4.3 避免索引失效的情况

以下情况可能导致索引失效：

使用函数或表达式：

SELECT * FROM users WHERE YEAR(created_at) = 2023;  -- 索引失效
SELECT * FROM users WHERE created_at >= '2023-01-01' AND created_at < '2024-01-01';  -- 有效使用索引

隐式类型转换：

SELECT * FROM users WHERE phone = '123456789';  -- 如果phone是INT类型，会发生隐式转换导致索引失效

使用 LIKE 前缀模糊匹配：

SELECT * FROM users WHERE name LIKE 'John%';  -- 有效使用索引
SELECT * FROM users WHERE name LIKE '%John';  -- 索引失效

OR 条件：

SELECT * FROM users WHERE id = 1 OR name = 'John';  -- 如果id和name没有同时建立复合索引，可能导致索引失效

4.4 覆盖索引（Covering Index）

覆盖索引指查询的列刚好是索引的列，此时不需要回表查询，可以直接从索引中获取数据。

示例：

-- 创建复合索引 (name, age)
CREATE INDEX idx_name_age ON users (name, age);-- 覆盖索引查询
SELECT name, age FROM users WHERE name = 'John';  -- 直接从索引中获取数据，无需回表

4.5 索引优化工具

-- 使用EXPLAIN分析查询
EXPLAIN SELECT * FROM users WHERE name = 'John';-- 查看索引使用情况
SHOW STATUS LIKE 'Handler_read%';-- 分析表以更新索引统计信息
ANALYZE TABLE table_name;-- 重建索引
REPAIR TABLE table_name QUICK;