当前位置: 首页 > news >正文

第14章 MySQL索引

第14章 MySQL索引

MySQL索引-语法

查看索引

查看索引的语法:

show  index  from  表名;

创建索引

创建索引语法如下:

create  [ unique ]  index 索引名 on  表名 (字段名,... ) ;

案例:为device_data 表的iot_id和product_key字段建立一个索引

create index idx_iot_id_product_key on device_data (iot_id, product_key);

在创建表时,如果添加了主键和唯一约束,就会默认创建:主键索引、唯一约束索引

注意事项:

  • 一般情况下,要选择经常作为查询条件的字段作为索引
  • 多字段做索引:idx_idx_location_type_physical_location_type_access_location

删除索引

语法:

drop  index  索引名  on  表名;

案例:删除 tb_emp 表中name字段的索引

drop index idx_iot_id_product_key on device_data ;

MySQL索引-分类

在MySQL数据库,将索引的具体类型主要分为以下几类:主键索引、唯一索引、常规索引、全文索引。

分类含义特点关键字
主键索引针对于表中主键创建的索引默认自动创建, 只能有一个PRIMARY
唯一索引避免同一个表中某数据列中的值重复可以有多个UNIQUE
常规索引快速定位特定数据可以有多个
全文索引全文索引查找的是文本中的关键词,而不是比较索引中的值可以有多个FULLTEXT

而在在InnoDB存储引擎中,根据索引的存储形式,又可以分为以下两种:

分类含义特点
聚集索引(Clustered Index)将数据存储与索引放到了一块,索引结构的叶子节点保存了行数据必须有,而且只有一个
二级索引(Secondary Index)将数据与索引分开存储,索引结构的叶子节点关联的是对应的主键可以存在多个

聚集索引(聚簇索引)选取规则:

  • 如果存在主键,主键索引就是聚集索引。
  • 如果不存在主键,将使用第一个唯一(UNIQUE)索引作为聚集索引。
  • 如果表没有主键,或没有合适的唯一索引,则InnoDB会自动生成一个rowid作为隐藏的聚集索引。

聚集索引和二级索引的具体结构如下:

在这里插入图片描述

  • 聚集索引的叶子节点下挂的是这一行的数据 。
  • 二级索引的叶子节点下挂的是该字段值对应的主键值。

接下来,咱们来分析一下,当咱们执行如下的SQL语句时,具体的查找过程是什么样子的。

在这里插入图片描述

具体过程如下:

①. 由于是根据name字段进行查询,所以先根据name='Arm’到name字段的二级索引中进行匹配查找。但是在二级索引中只能查找到 Arm 对应的主键值 10。

②. 由于查询返回的数据是*,所以此时还需要根据主键值10,到聚集索引中查找10对应的记录,最终找到10对应的行row。

③. 最终拿到这一行的数据,直接返回即可。

回表查询: 这种先到二级索引中查找数据,找到主键值,然后再到聚集索引中根据主键值,获取数据的方式,就称之为回表查询。

索引失效检查

可以采用EXPLAIN 或者 DESC命令获取 SELECT 语句的执行计划

语法:

EXPLAIN   SELECT   字段列表   FROM   表名   WHERE  条件 ;

在这里插入图片描述

  • possible_keys 当前sql可能会使用到的索引

  • key 当前sql实际命中的索引

  • key_len 索引(物理内存)占用的大小

    • 常见数据类型大致的 key_len计算方式(以常见默认设置为例):

      数据类型是否允许 NULL字符集(如适用)大致 key_len 值计算说明
      INT-4 字节固定长度 4 字节
      INT-5 字节4 字节 + 1 字节(NULL 标识)
      BIGINT-8 字节固定长度 8 字节
      VARCHAR(10)utf8mb442 字节10字符 * 4字节/字符 + 2字节(记录实际长度)
      VARCHAR(10)utf8mb443 字节上述 42 字节 + 1 字节(NULL 标识)
      CHAR(10)utf8mb440 字节10字符 * 4字节/字符
  • Extra 额外的优化建议

    • Extra含义
      Using index查找使用了索引,需要的数据都在索引列中能找到,不需要回表查询数据
      Using where没有找到合适的索引
      Using index condition查找使用了部分索引,但是需要回表查询数据
      Using where; Using index查找使用了部分索引,需要的数据都在索引列中能找到,不需要回表查询数据
  • type 这条sql的连接的类型,性能由好到差为NULL、system、const、eq_ref、ref、range、 index、all

    • system:查询最多只有一条记录的表,几乎不会出现
    • const:根据主键查询(只扫描一行。效率最高)
    • eq_ref:主键索引查询或唯一索引查询(通常是多表联查中性能最优的连接类型之一)
    • ref:索引查询(扫描索引中匹配某个单值的所有行)
    • range:范围查询(扫描索引中特定范围的条目)
    • index:索引树扫描(扫描整个索引结构,比 all 好)
    • all:全盘扫描(扫描整张表,效率低)

索引失效场景

  • 不符合最左匹配法则
  • 范围查询右边的列,不能使用索引
  • 不要在索引列上进行运算操作, 索引将失效
  • 字符串不加单引号,造成索引失效(类型转换)
  • 以%开头的Like模糊查询,索引失效

索引可存储行数

计算一个三层的 B+Tree 数据结构的索引可存储多少行数据

三层 B+ 树索引能存储的数据量取决于几个关键参数。下面是一个快速参考表格:

关键参数典型值/假设说明
节点大小(页大小)16 KBInnoDB 存储引擎的默认设置,是磁盘 I/O 和数据存储的基本单元。
主键类型BIGINT(8 字节)假设使用 8 字节的长整型作为主键。
指针大小6 字节InnoDB 中指向子节点(页)的指针通常占用 6 字节。
单行数据大小1 KB一个常见的业务表数据行大小的估算值。
非叶子节点容量约 1170 个索引项单个非叶子节点可存储的键值对(主键+指针)数量,计算过程见下文。
叶子节点容量16 行数据单个叶子节点可存储的数据行数量,计算过程见下文。
总数据行数约 2190 万行在以上典型假设下,三层 B+ 树能存储的估算数据总量。

⚖️ 重要影响因素

需要强调的是,“约2190万行”是一个基于特定假设的理论值。实际情况会受到以下因素影响:

  • 主键类型:若使用 4 字节的 INT 主键,指针仍为6字节,则索引项变为10字节。分支因子 fan_out = 16384 / 10 ≈ 1638。总叶子节点数 = 1638 * 1638 ≈ 2,683,044个。若每行仍为1KB,则总行数可达 2,683,044 * 16 ≈ 42,928,704行。可见主键类型影响巨大。

  • 行实际大小:这是另一个关键变量。如果你的表字段很少,单行大小只有 200 字节,那么一个叶子页可存储 16KB / 0.2KB ≈ 80行。总行数会非常庞大(1,368,900 * 80 ≈ 1.09亿行)。反之,若单行很大(例如包含长文本),存储的行数会急剧减少。

  • 页面填充率:上面的计算均假设每个页都100%填满。但实际上,由于数据不断的插入、删除和更新,页面会存在一定的碎片空间,平均填充率可能只有 70% - 90%。因此,实际存储量通常低于理论值。

  • 索引类型:以上计算针对的是聚簇索引(在InnoDB中通常就是主键索引),其叶子节点直接存储完整行数据。如果是二级索引(非聚簇索引),其叶子节点存储的是主键值而非完整数据。

    因此,相同条件下,一个三级B+树的二级索引可以“覆盖”的行数会多得多,因为它每页能存储的索引条目更多。

🔍 补充说明

  • 如果键更大(如 UUID,16 字节),扇出会降低,总容量减少。
  • 如果页更大(如使用 32KB 或 64KB 页),容量会显著增加。
  • 实际中还会受填充因子、行格式、变长字段等影响,此为理论最大值。
http://www.dtcms.com/a/394579.html

相关文章:

  • Entities - 遍历与查询
  • TargetGroup 全面优化:从六个维度打造卓越用户体验
  • Proxy与Reflect
  • 浅解Letterbox算法
  • 【Triton 教程】triton_language.permute
  • JavaScript洗牌算法实践
  • 掌握timedatectl命令:Ubuntu 系统时间管理指南
  • 【RT Thread】RTT内核对象机制详解
  • Seata分布式事务
  • 用例图讲解
  • makefile原理
  • AUTOSAR CP开发流程总结
  • 通过VNC实现树莓派远程桌面访问
  • linux信号done
  • BeanUtils.copyProperties 映射规则详解
  • 物联网 frid卡控制
  • LeetCode刷题记录----322.零钱兑换(Medium)
  • 2015/07 JLPT听力原文 问题四
  • Redis集群实验
  • 昇腾生态双支柱:MindSpore 与 CANN 的全栈技术解析
  • YOLO系列——实时屏幕检测
  • 牛客算法基础noob49 上三角矩阵判定
  • autosar 中OS模块理解
  • 通俗范畴论17.2 向量空间的对偶与双对偶
  • huggingface_hub 安装部署问题汇总
  • 在我的Java项目中为什么使用AllArgsConstructor注解注入的方式启动报错了:
  • π0:一个 VLA 流匹配模型用于通用机器人控制(又称 pi0)
  • Information theorem-Entropy
  • 编译原理实验报告——词法分析程序
  • 整体设计 完整的逻辑链条 之4 认知逻辑视角 —— 前序驱动的认知演进体系 之2