当前位置：首页 > news >正文

MySQL进阶

news 2025/11/4 10:20:05

一、存储引擎

-- 建表时指定存储引擎
CREATE TABLE 表名(
	...
) ENGINE=INNODB;
-- 查看当前数据库支持的存储引擎
SHOW ENGINES;

InnoDB

InnoDB 是一种兼顾高可靠性和高性能的通用存储引擎，在 MySQL 5.5 之后，InnoDB 是默认的 MySQL 引擎。

特点：

DML 操作遵循 ACID 模型，支持事务

行级锁，提高并发访问性能

支持外键约束，保证数据的完整性和正确性

xxxx.idb:一个InnoDB表名为xxxx，InnoDB 引擎的每张表都会对应这样一个表空间文件，存储该表的表结构（frm、sdi）、数据和索引。

参数：innodb_file_per_table，决定多张表共享一个表空间还是每张表对应一个表空间

从idb文件提取表结构数据：
（在cmd运行）

ibd2sdi xxx.ibd

上面的代码在idb文件中提取sdi表结构数据。

MyISAM

MySQL早期的默认存储引擎

特点：

不支持事务，不支持外键

支持表锁，不支持行锁

访问速度快

xxx.sdi: 存储表结构信息

xxx.MYD: 存储数据

xxx.MYI: 存储索引

Memory

Memory 引擎的表数据是存储在内存中的，受硬件问题、断电问题的影响，只能将这些表作为临时表或缓存使用。

特点：

存放在内存中，速度快

hash索引（默认）

xxx.sdi: 存储表结构信息

对比

特点	InnoDB	MyISAM	Memory
存储限制	64TB	有	有
事务安全☆	支持	不支持	不支持
锁机制☆	行锁	表锁	表锁
B+tree索引	支持	支持	支持
Hash索引	不支持	不支持	支持
全文索引	支持（5.6版本之后）	支持	不支持
空间使用	高	低	N/A
内存使用	高	低	中等
批量插入速度	低	高	高
支持外键☆	支持	不支持	不支持

选择

InnoDB: 如果应用对事物的完整性有比较高的要求，在并发条件下要求数据的一致性，数据操作除了插入和查询之外，还包含很多的更新、删除操作，则 InnoDB 是比较合适的选择
MyISAM: 如果应用是以读操作和插入操作为主，只有很少的更新和删除操作，并且对事务的完整性、并发性要求不高，那这个存储引擎是非常合适的。
Memory: 将所有数据保存在内存中，访问速度快，通常用于临时表及缓存。Memory 的缺陷是对表的大小有限制，太大的表无法缓存在内存中，而且无法保障数据的安全性

电商中的足迹和评论适合使用 MyISAM 引擎，缓存适合使用 Memory 引擎。

应用

InnoDB：存储业务系统中对于事务、数据完整性要求较高的核心数据。

MyISAM：存储业务系统的非核心事务。

二、索引

概述

索引是帮助MySQL高效获取数据的有序数据结构。

查找age为45

优点

提高数据检索效率，降低数据库的IO成本

通过索引列对数据进行排序，降低数据排序的成本，降低CPU的消耗

缺点

索引列也是要占用空间的

索引大大提高了查询效率，但降低了更新的速度，比如 INSERT、UPDATE、DELETE

结构

索引结构	描述
B+Tree	最常见的索引类型，大部分引擎都支持B+树索引
Hash	底层数据结构是用哈希表实现，只有精确匹配索引列的查询才有效，不支持范围查询
R-Tree(空间索引)	空间索引是 MyISAM 引擎的一个特殊索引类型，主要用于地理空间数据类型，通常使用较少
Full-Text(全文索引)	是一种通过建立倒排索引，快速匹配文档的方式，类似于 Lucene, Solr, ES

不同索引在存储引擎中的支持情况

索引	InnoDB	MyISAM	Memory
B+Tree索引	支持	支持	支持
Hash索引	不支持	不支持	支持
R-Tree索引	不支持	支持	不支持
Full-text	5.6版本后支持	支持	不支持

基础——二叉树

二叉树缺点：

1.顺序插入时，会形成一个链表，查询性能大大降低。

2.大数据量情况下，层级较深，检索速度慢。

对于缺点1：使用红黑树。红黑树是一种自平衡的二叉树

对于缺点2：使用B-Tree。

基础——B-Tree

又称为多路平衡查找树，以一颗最大度数（树的度数是一个节点的子节点个数）为5的B-Tree为例，每个节点最多存储4个KEY，5个指针：

可以访问数据结构可视化网站：B-Tree Visualization

B+Tree☆

所有的元素都会出现在叶子节点，且叶子节点会形成一个单向链表。

可以访问数据结构可视化网站：B+ Tree Visualization

MySQL在原B+Tree的基础上增加了一个指向相邻叶子节点的链表指针，就形成了带有顺序指针的B+Tree，提高了区间访问的性能。

Hash☆

哈希索引就是采用一定的hash算法，将键值换算成新的hash值，映射到对应的槽位上，然后存储在hash表中。
如果两个（或多个）键值，映射到一个相同的槽位上，他们就产生了hash冲突（也称为hash碰撞），可以通过链表来解决。

hash索引特点

Hash索引只能用于对等比较（=、in），不支持范围查询（betwwn、>、<、…）

无法利用索引完成排序操作

查询效率高，通常只需要一次检索就可以了，效率通常要高于 B+Tree 索引

如果出现哈希碰撞，则不止需要一次检索，还需要去链表中进行对比查找。

支持hash的存储引擎

Memory。InnoDB可以自适应。

为什么InnoDB存储引擎选择使用B+Tree索引结构

相对于二叉树，层级更少，搜索效率高。

为什么没有采用B树

思考过程：B+树中只有叶子节点存放数据，上面的节点仅仅存放索引。B树的叶子节点和非叶子节点都存放数据。查找数据时必须到B+树中的叶子节点才能找到数据。B+树中的叶子节点形成了双向链表。

对于 B-Tree，无论是叶子节点还是非叶子节点，都会保存数据，这样导致一页中存储的键值减少，指针也跟着减少，要同样保存大量数据，只能增加树的高度，导致性能降低。

为什么没有采用Hash索引

对于hash索引，B+tree支持范围匹配和排序操作。

分类

分类	含义	特点	关键字
主键索引	针对于表中主键创建的索引	默认自动创建，只能有一个	PRIMARY
唯一索引	避免同一个表中某数据列中的值重复	可以有多个	UNIQUE
常规索引	快速定位特定数据	可以有多个
全文索引	全文索引查找的是文本中的关键词，而不是比较索引中的值	可以有多个	FULLTEXT

在InnoDB存储引擎中，根据索引的存储形式，可以分为

分类	含义	特点
聚集索引 (Clustered Index)	将数据存储与索引放一块，索引结构的叶子节点保存了行数据	必须有，而且只有一个
二级索引(Secondary Index)	将数据与索引分开存储，索引结构的叶子节点关联的是对应的主键	可以存在多个

分类

含义

特点

聚集索引

(Clustered Index)

将数据存储与索引放一块，索引结构的叶子节点保存了行数据

必须有，而且只有一个

二级索引(Secondary Index)

将数据与索引分开存储，索引结构的叶子节点关联的是对应的主键

可以存在多个

二级索引也称为辅助索引、非聚集索引。顾名思义，二级索引指向的也是索引。