当前位置：首页 > news >正文

关于数据库的慢查询

news 2025/7/14 6:17:47

1.数据库的慢查询

慢查询是指执行时间超过预设阈值的数据库查询操作。它是数据库性能优化的一个重要指标和切入点。

慢查询的主要特点

执行时间长：超过了数据库系统设定的慢查询阈值（如MySQL默认是10秒）
资源消耗大：可能占用大量CPU、内存或I/O资源
影响整体性能：会拖慢整个数据库系统的响应速度

慢查询的常见原因

缺少合适的索引：没有为查询条件建立索引或索引设计不合理
SQL语句编写不佳：如使用SELECT *、复杂的子查询、不必要的JOIN操作等
大数据量操作：单次查询处理大量数据
锁竞争：查询被其他事务阻塞
数据库设计问题：表结构设计不合理，如缺少必要的字段或过度规范化

如何识别慢查询

数据库日志：MySQL的slow query log
监控工具：如Percona PMM、Datadog等
EXPLAIN分析：查看查询执行计划
性能模式：MySQL的performance_schema

慢查询优化方法

添加适当索引：基于查询条件创建合适的索引
重写SQL：简化复杂查询，避免全表扫描
分页处理：大数据量查询使用LIMIT分页
数据库调优：调整数据库配置参数
缓存策略：对频繁查询但不常变的数据使用缓存

慢查询分析是数据库性能优化的基础工作，定期检查和优化慢查询可以显著提升数据库整体性能。

2.关于查询阈值

数据库慢查询的预设阈值（即执行时间超过多少秒算作慢查询）并没有统一标准，主要取决于业务需求、数据库类型和性能要求。以下是常见场景的参考值：

1. 默认阈值（不同数据库）

数据库类型	默认阈值	配置参数
MySQL	10秒	`long_query_time`
PostgreSQL	无默认值（需手动设置）	`log_min_duration_statement`
SQL Server	无默认值（通过扩展事件/XEvent配置）	-
Oracle	无默认值（通过AWR/ASH报告分析）	`DBMS_MONITOR`

2. 实际业务中的建议阈值

OLTP系统（高并发交易场景）: 100ms~1s
（如电商、支付系统，要求快速响应）
OLAP系统（分析型查询）: 5s~10s
（如报表查询，允许更长时间）
内部管理后台：1s~3s
（对用户体验要求较低的场景）

3. 如何设置合理阈值？

基准测试：通过压测工具（如Sysbench、JMeter）观察正常查询的响应时间分布。
业务需求：根据用户可容忍的等待时间调整（如API响应SLA要求）。
渐进调整：
- 从严格阈值开始（如1秒），逐步放宽并观察影响。
- 示例（MySQL）：
```
-- 临时设置为1秒
SET GLOBAL long_query_time = 1;
-- 永久生效需修改my.cnf
```

4. 注意事项

避免过严：阈值太小会导致日志爆炸，难以分析真正问题。
动态调整：高峰期可适当放宽阈值，低峰期收紧。
结合其他指标：
即使未超阈值，但高频执行的查询（如每秒100次×200ms）也可能需要优化。

5. 扩展工具

MySQL：

-- 查看当前阈值
SHOW VARIABLES LIKE 'long_query_time';
-- 启用慢查询日志
SET GLOBAL slow_query_log = 'ON';

PostgreSQL：

-- 设置记录超过500ms的查询
ALTER SYSTEM SET log_min_duration_statement = 500;

根据实际场景灵活调整阈值，并配合监控工具（如Prometheus + Grafana）长期观察趋势。

3.慢查询场景分析

一、索引优化策略

1. 添加缺失索引

案例：用户表无索引导致查询缓慢

-- 优化前（耗时1200ms）
SELECT * FROM users WHERE username = 'john_doe';-- 优化后（添加索引，耗时5ms）
ALTER TABLE users ADD INDEX idx_username(username);
SELECT * FROM users WHERE username = 'john_doe';

2. 复合索引优化

案例：多条件查询效率低

-- 优化前（全表扫描，耗时800ms）
SELECT * FROM orders 
WHERE user_id = 100 AND status = 'completed' AND create_time > '2023-01-01';-- 优化后（创建复合索引，耗时15ms）
ALTER TABLE orders ADD INDEX idx_user_status_time(user_id, status, create_time);

二、SQL语句优化策略

1. 避免SELECT *

案例：查询不需要的列

-- 优化前（返回所有列，耗时450ms）
SELECT * FROM products WHERE category = 'electronics';-- 优化后（只查询必要列，耗时120ms）
SELECT product_id, product_name, price FROM products WHERE category = 'electronics';

2. 分页优化

案例：大数据量分页

-- 优化前（LIMIT深分页，耗时1500ms）
SELECT * FROM logs ORDER BY id LIMIT 100000, 20;-- 优化后（使用游标分页，耗时30ms）
SELECT * FROM logs WHERE id > 100000 ORDER BY id LIMIT 20;

三、JOIN优化策略

1. 小表驱动大表

案例：JOIN顺序不当

-- 优化前（大表驱动小表，耗时3200ms）
SELECT * FROM large_table l JOIN small_table s ON l.id = s.large_id;-- 优化后（小表驱动大表，耗时400ms）
SELECT * FROM small_table s JOIN large_table l ON s.large_id = l.id;

2. 避免笛卡尔积

案例：缺少JOIN条件

-- 优化前（产生笛卡尔积，耗时15秒）
SELECT * FROM table_a, table_b WHERE table_a.status = 1;-- 优化后（明确JOIN条件，耗时200ms）
SELECT * FROM table_a JOIN table_b ON table_a.id = table_b.a_id WHERE table_a.status = 1;

四、子查询优化策略

1. 用JOIN替代子查询

案例：IN子查询效率低

-- 优化前（子查询，耗时800ms）
SELECT * FROM users WHERE id IN (SELECT user_id FROM orders WHERE amount > 1000);-- 优化后（使用JOIN，耗时150ms）
SELECT u.* FROM users u JOIN orders o ON u.id = o.user_id WHERE o.amount > 1000;

2. EXISTS替代IN

案例：大数据集IN查询

-- 优化前（IN列表过长，耗时5秒）
SELECT * FROM products WHERE id IN (1,3,5,...,10000);-- 优化后（使用EXISTS，耗时300ms）
SELECT p.* FROM products p WHERE EXISTS (SELECT 1 FROM product_ids pi WHERE pi.id = p.id);

五、函数和类型转换优化

1. 避免索引列使用函数

案例：函数导致索引失效

-- 优化前（索引失效，耗时1200ms）
SELECT * FROM orders WHERE DATE(create_time) = '2023-01-01';-- 优化后（使用范围查询，耗时50ms）
SELECT * FROM orders WHERE create_time >= '2023-01-01' AND create_time < '2023-01-02';

2. 类型匹配优化

案例：隐式类型转换

-- 优化前（varchar和int比较，耗时800ms）
SELECT * FROM products WHERE product_code = 12345;-- 优化后（类型一致，耗时30ms）
SELECT * FROM products WHERE product_code = '12345';

六、数据库配置优化

1. 调整慢查询阈值

-- MySQL设置慢查询阈值为1秒
SET GLOBAL long_query_time = 1;

2. 启用慢查询日志

-- MySQL启用慢查询日志
SET GLOBAL slow_query_log = 'ON';
SET GLOBAL log_queries_not_using_indexes = 'ON';

七、执行计划分析

1. EXPLAIN分析

-- 查看查询执行计划
EXPLAIN SELECT * FROM users WHERE username = 'john_doe';

2. 优化器提示

-- 强制使用特定索引
SELECT * FROM users FORCE INDEX(idx_username) WHERE username = 'john_doe';

八、其他高级优化

1. 分区表优化

-- 按时间范围分区
ALTER TABLE logs PARTITION BY RANGE (YEAR(create_time)) (PARTITION p2022 VALUES LESS THAN (2023),PARTITION p2023 VALUES LESS THAN (2024)
);

2. 物化视图

-- 创建汇总表
CREATE MATERIALIZED VIEW sales_summary AS
SELECT product_id, SUM(amount) as total_sales
FROM orders
GROUP BY product_id;

以上案例中的耗时数据是基于典型生产环境的近似值，实际性能提升效果会因数据量、硬件配置和数据库版本等因素而有所不同。建议在实际环境中使用EXPLAIN分析并结合数据库监控工具进行验证。

查看全文

http://www.dtcms.com/a/277175.html

python3的可变参数如何传递元组和字典

一文讲懂填充与步幅

《Google 软件工程》：如何写好文档？

3. 【Blazor全栈开发实战指南】--Blazor是什么？为什么选择Blazor？

在AI应用中Prompt撰写重要却难掌握，‘理解模型与行业知识是关键’：提升迫在眉睫

【读书笔记】《Effective Modern C++》第4章 Smart Pointers

Node.js 聊天内容加密解密实战教程（含缓存密钥优化）

4. 关于CEF3 使用的一些记录及仓颉端封装的情况

手写muduo笔记

package.json 与 package-lock.json

笔记/sklearn中的数据划分方法

流程控制：从基础结构到跨语言实践与优化

博客项目 laravel vue mysql 第五章标签功能

前端性能优化利器：懒加载技术原理与最佳实践

JAVA JVM虚拟线程

第三章-提示词-解锁Prompt提示词工程核销逻辑，开启高效AI交互（10/36）

Vue3 Diff 算法片段解析：新旧节点队列之乱序比对与更新策略

7月13日星期日今日早报简报微语报早读

Python PyWhat详解：一款高效的数据类型识别与扫描工具

把固态电池当“显卡”用：基于Li⁺迁移率的矩阵乘法加速器——电解质-权重共设计框架与FP8训练实战

C++--List的模拟实现

深入解析Hadoop RPC：技术细节与推广应用

vue3 ref vs reactive值的修改

自动润滑系统：从 “盲目养护“ 到智能精注的工业运维革命

【芯片笔记】ADF4159

详解Linux下多进程与多线程通信（一）

python：使用openpyxl库，实现excel表格的创建、查询（读取）、修改、插入数据

LVS负载均衡集群概述

论文笔记：AnImitation Learning Approach for Cache Replacement

iOS高级开发工程师面试——架构设计