一条SQL的执行过程
一条 SQL 语句的完整执行过程可以拆解为 解析→优化→执行→返回 四个核心阶段,但不同数据库的实现细节会有所差异。本文以MySQL为例来讲解的一条SQL的完整执行流程:
一、MySQL的基本架构
MySQL大体分为:Server 层和存储引擎层。
1.Server 层
(1)连接器(Connection Manager)
核心职责:
▸ 管理客户端与服务端通信协议(TCP/SSL)
▸ 身份认证(用户名/密码校验)与权限验证
▸ 维护连接池复用机制(如MySQL线程池)
关键特性:
▸ 支持长连接/短连接模式
▸ 超时自动断开机制(wait_timeout参数控制)
(2)查询缓存(Query Cache) [MySQL 8.0已移除]
历史作用:
▸ 缓存SELECT语句及其结果集(Key-Value结构)
▸ 命中缓存时直接返回结果,跳过后续处理
淘汰原因:
▸ 表数据变更导致缓存频繁失效(写密集场景性能反降)
▸ 全局锁竞争引发吞吐量瓶颈
▸ 现代替代方案:应用层缓存(如Redis)+ 查询性能优化
(3)分析器(Parser)
双阶段处理:
▸ 词法分析:SQL文本 → Token流(识别关键字/表名/列名)
▸ 语法分析:Token流 → 抽象语法树(AST),校验语法合法性
语义校验:
▸ 对象存在性检查(表/列是否在数据字典中)
▸ 类型兼容性验证(如WHERE字符串与数字列比较报错)
(4)优化器(Optimizer)
优化策略:
▸ 逻辑优化:子查询重写、条件化简、外连接转内连接
▸ 物理优化:索引选择(cost模型)、连接顺序调整、访问路径决策
成本模型:
▸ 基于统计信息(行数、索引基数)估算IO/CPU消耗
▸ 常见误差来源:统计信息过期导致次优计划
(5)执行器(Executor)
执行流程:
▸ 调用存储引擎接口按执行计划逐级读取数据
▸ 实施运行时过滤(如无法下推的WHERE条件)
▸ 处理排序(filesort)、分组(临时表)、连接操作
事务控制:
▸ 协同存储引擎管理事务ACID特性
▸ 通过锁机制或MVCC实现隔离性
2.存储引擎层
负责数据的存储和提取。Mysql支持InnoDB、MyISAM、Memory 等多个存储引擎。从 MySQL 5.5 版本开始,InnoDB为默认存储引擎。
二、SQL的完整执行过程
主要可以分为以下几个阶段:
1.SQL 解析(Parsing)
当执行一条SQL语句时,数据库首先会进行解析。
这个阶段包括:
(1)词法分析(Lexical Analysis)
数据库会将SQL语句转化为一个个词法单元(Token),例如关键字、字段名、表名、操作符等。
(2)语法分析(Syntax Analysis)
数据库检查SQL语句是否符合语法规则,并且构建一个语法树(Parse Tree)或抽象语法树(Abstract Syntax Tree,AST)。
2. 查询优化(Optimization)
一旦SQL语句被解析成功,接下来是查询优化阶段。
在这一阶段,数据库会根据不同的策略和算法,选择最优的执行计划。
具体优化方式包括:
(1)选择合适的索引
数据库会判断是否需要使用索引来加速查询。
(2)重排操作顺序
数据库可能会调整SQL中的操作顺序,特别是多个表的连接操作(JOIN)和WHERE条件的处理顺序。
(3)估算数据量
数据库通过统计信息估算查询过程中各个操作的成本,选择成本最低的执行方案。
3.执行计划生成(Execution Plan Generation)
在优化阶段之后,数据库会生成一个执行计划,指示如何具体执行SQL语句。执行计划会以树形结构展现,每个节点代表一个操作(例如扫描表、连接操作、排序等)。
4.执行(Execution)
根据生成的执行计划,数据库开始执行SQL语句。
执行过程可能包括:
(1)数据访问
数据库通过读取表、索引或缓存来获取数据。
(2)数据处理
执行各种SQL操作,如筛选、排序、聚合、连接等。
(3)结果集生成
最终生成查询结果集。
5.返回结果(Returning Results)
执行完毕后,数据库将查询结果返回给客户端或应用程序。
如果是修改数据的操作(如INSERT、UPDATE、DELETE),则返回影响的行数。
6.事务管理(Transaction Management)
如果SQL语句是属于事务的一部分(例如事务中的多条SQL语句),则数据库会确保ACID特性(原子性、一致性、隔离性、持久性)得到遵守。
事务管理包括:
(1)提交(Commit)
事务成功执行后,所有的修改会被永久保存。
(2)回滚(Rollback)
若发生错误,事务的所有修改会被撤销,数据恢复到事务开始前的状态。
三、总结
SQL执行的完整过程包括:解析、优化、生成执行计划、执行、返回结果和事务管理。每个步骤都有其重要作用,共同确保SQL语句高效且正确地执行。