当前位置: 首页 > news >正文

关于数据库的慢查询

1.数据库的慢查询

慢查询是指执行时间超过预设阈值的数据库查询操作。它是数据库性能优化的一个重要指标和切入点。

慢查询的主要特点

  1. 执行时间长:超过了数据库系统设定的慢查询阈值(如MySQL默认是10秒)

  2. 资源消耗大:可能占用大量CPU、内存或I/O资源

  3. 影响整体性能:会拖慢整个数据库系统的响应速度

慢查询的常见原因

  1. 缺少合适的索引:没有为查询条件建立索引或索引设计不合理

  2. SQL语句编写不佳:如使用SELECT *、复杂的子查询、不必要的JOIN操作等

  3. 大数据量操作:单次查询处理大量数据

  4. 锁竞争:查询被其他事务阻塞

  5. 数据库设计问题:表结构设计不合理,如缺少必要的字段或过度规范化

如何识别慢查询

  1. 数据库日志:MySQL的slow query log

  2. 监控工具:如Percona PMM、Datadog等

  3. EXPLAIN分析:查看查询执行计划

  4. 性能模式:MySQL的performance_schema

慢查询优化方法

  1. 添加适当索引:基于查询条件创建合适的索引

  2. 重写SQL:简化复杂查询,避免全表扫描

  3. 分页处理:大数据量查询使用LIMIT分页

  4. 数据库调优:调整数据库配置参数

  5. 缓存策略:对频繁查询但不常变的数据使用缓存

慢查询分析是数据库性能优化的基础工作,定期检查和优化慢查询可以显著提升数据库整体性能。

2.关于查询阈值

数据库慢查询的预设阈值(即执行时间超过多少秒算作慢查询)并没有统一标准,主要取决于业务需求、数据库类型和性能要求。以下是常见场景的参考值:


1. 默认阈值(不同数据库)

数据库类型默认阈值配置参数
MySQL10秒long_query_time
PostgreSQL无默认值(需手动设置)log_min_duration_statement
SQL Server无默认值(通过扩展事件/XEvent配置)-
Oracle无默认值(通过AWR/ASH报告分析)DBMS_MONITOR

2. 实际业务中的建议阈值

  • OLTP系统(高并发交易场景): 100ms~1s
    (如电商、支付系统,要求快速响应)

  • OLAP系统(分析型查询): 5s~10s
    (如报表查询,允许更长时间)

  • 内部管理后台1s~3s
    (对用户体验要求较低的场景)


3. 如何设置合理阈值?

  1. 基准测试:通过压测工具(如Sysbench、JMeter)观察正常查询的响应时间分布。

  2. 业务需求:根据用户可容忍的等待时间调整(如API响应SLA要求)。

  3. 渐进调整

    • 从严格阈值开始(如1秒),逐步放宽并观察影响。

    • 示例(MySQL):

      -- 临时设置为1秒
      SET GLOBAL long_query_time = 1;
      -- 永久生效需修改my.cnf

4. 注意事项

  • 避免过严:阈值太小会导致日志爆炸,难以分析真正问题。

  • 动态调整:高峰期可适当放宽阈值,低峰期收紧。

  • 结合其他指标
    即使未超阈值,但高频执行的查询(如每秒100次×200ms)也可能需要优化。


5. 扩展工具

  • MySQL

    -- 查看当前阈值
    SHOW VARIABLES LIKE 'long_query_time';
    -- 启用慢查询日志
    SET GLOBAL slow_query_log = 'ON';
  • PostgreSQL

    -- 设置记录超过500ms的查询
    ALTER SYSTEM SET log_min_duration_statement = 500;

根据实际场景灵活调整阈值,并配合监控工具(如Prometheus + Grafana)长期观察趋势。

3.慢查询场景分析

一、索引优化策略

1. 添加缺失索引

案例:用户表无索引导致查询缓慢

-- 优化前(耗时1200ms)
SELECT * FROM users WHERE username = 'john_doe';-- 优化后(添加索引,耗时5ms)
ALTER TABLE users ADD INDEX idx_username(username);
SELECT * FROM users WHERE username = 'john_doe';

2. 复合索引优化

案例:多条件查询效率低

-- 优化前(全表扫描,耗时800ms)
SELECT * FROM orders 
WHERE user_id = 100 AND status = 'completed' AND create_time > '2023-01-01';-- 优化后(创建复合索引,耗时15ms)
ALTER TABLE orders ADD INDEX idx_user_status_time(user_id, status, create_time);

二、SQL语句优化策略

1. 避免SELECT *

案例:查询不需要的列

-- 优化前(返回所有列,耗时450ms)
SELECT * FROM products WHERE category = 'electronics';-- 优化后(只查询必要列,耗时120ms)
SELECT product_id, product_name, price FROM products WHERE category = 'electronics';

2. 分页优化

案例:大数据量分页

-- 优化前(LIMIT深分页,耗时1500ms)
SELECT * FROM logs ORDER BY id LIMIT 100000, 20;-- 优化后(使用游标分页,耗时30ms)
SELECT * FROM logs WHERE id > 100000 ORDER BY id LIMIT 20;

三、JOIN优化策略

1. 小表驱动大表

案例:JOIN顺序不当

-- 优化前(大表驱动小表,耗时3200ms)
SELECT * FROM large_table l JOIN small_table s ON l.id = s.large_id;-- 优化后(小表驱动大表,耗时400ms)
SELECT * FROM small_table s JOIN large_table l ON s.large_id = l.id;

2. 避免笛卡尔积

案例:缺少JOIN条件

-- 优化前(产生笛卡尔积,耗时15秒)
SELECT * FROM table_a, table_b WHERE table_a.status = 1;-- 优化后(明确JOIN条件,耗时200ms)
SELECT * FROM table_a JOIN table_b ON table_a.id = table_b.a_id WHERE table_a.status = 1;

四、子查询优化策略

1. 用JOIN替代子查询

案例:IN子查询效率低

-- 优化前(子查询,耗时800ms)
SELECT * FROM users WHERE id IN (SELECT user_id FROM orders WHERE amount > 1000);-- 优化后(使用JOIN,耗时150ms)
SELECT u.* FROM users u JOIN orders o ON u.id = o.user_id WHERE o.amount > 1000;

2. EXISTS替代IN

案例:大数据集IN查询

-- 优化前(IN列表过长,耗时5秒)
SELECT * FROM products WHERE id IN (1,3,5,...,10000);-- 优化后(使用EXISTS,耗时300ms)
SELECT p.* FROM products p WHERE EXISTS (SELECT 1 FROM product_ids pi WHERE pi.id = p.id);

五、函数和类型转换优化

1. 避免索引列使用函数

案例:函数导致索引失效

-- 优化前(索引失效,耗时1200ms)
SELECT * FROM orders WHERE DATE(create_time) = '2023-01-01';-- 优化后(使用范围查询,耗时50ms)
SELECT * FROM orders WHERE create_time >= '2023-01-01' AND create_time < '2023-01-02';

2. 类型匹配优化

案例:隐式类型转换

-- 优化前(varchar和int比较,耗时800ms)
SELECT * FROM products WHERE product_code = 12345;-- 优化后(类型一致,耗时30ms)
SELECT * FROM products WHERE product_code = '12345';

六、数据库配置优化

1. 调整慢查询阈值

-- MySQL设置慢查询阈值为1秒
SET GLOBAL long_query_time = 1;

2. 启用慢查询日志

-- MySQL启用慢查询日志
SET GLOBAL slow_query_log = 'ON';
SET GLOBAL log_queries_not_using_indexes = 'ON';

七、执行计划分析

1. EXPLAIN分析

-- 查看查询执行计划
EXPLAIN SELECT * FROM users WHERE username = 'john_doe';

2. 优化器提示

-- 强制使用特定索引
SELECT * FROM users FORCE INDEX(idx_username) WHERE username = 'john_doe';

八、其他高级优化

1. 分区表优化

-- 按时间范围分区
ALTER TABLE logs PARTITION BY RANGE (YEAR(create_time)) (PARTITION p2022 VALUES LESS THAN (2023),PARTITION p2023 VALUES LESS THAN (2024)
);

2. 物化视图

-- 创建汇总表
CREATE MATERIALIZED VIEW sales_summary AS
SELECT product_id, SUM(amount) as total_sales
FROM orders
GROUP BY product_id;

以上案例中的耗时数据是基于典型生产环境的近似值,实际性能提升效果会因数据量、硬件配置和数据库版本等因素而有所不同。建议在实际环境中使用EXPLAIN分析并结合数据库监控工具进行验证。

http://www.dtcms.com/a/277175.html

相关文章:

  • python3的可变参数如何传递元组和字典
  • 一文讲懂填充与步幅
  • 《Google 软件工程》:如何写好文档?
  • 3. 【Blazor全栈开发实战指南】--Blazor是什么?为什么选择Blazor?
  • 在AI应用中Prompt撰写重要却难掌握,‘理解模型与行业知识是关键’:提升迫在眉睫
  • 【读书笔记】《Effective Modern C++》第4章 Smart Pointers
  • Node.js 聊天内容加密解密实战教程(含缓存密钥优化)
  • 4. 关于CEF3 使用的一些记录及仓颉端封装的情况
  • 手写muduo笔记
  • package.json 与 package-lock.json
  • 笔记/sklearn中的数据划分方法
  • 流程控制:从基础结构到跨语言实践与优化
  • 博客项目 laravel vue mysql 第五章 标签功能
  • 前端性能优化利器:懒加载技术原理与最佳实践
  • JAVA JVM虚拟线程
  • 第三章-提示词-解锁Prompt提示词工程核销逻辑,开启高效AI交互(10/36)
  • Vue3 Diff 算法片段解析:新旧节点队列之乱序比对与更新策略
  • 7月13日星期日今日早报简报微语报早读
  • Python PyWhat详解:一款高效的数据类型识别与扫描工具
  • 把固态电池当“显卡”用:基于Li⁺迁移率的矩阵乘法加速器——电解质-权重共设计框架与FP8训练实战
  • C++--List的模拟实现
  • 深入解析Hadoop RPC:技术细节与推广应用
  • vue3 ref vs reactive值的修改
  • 自动润滑系统:从 “盲目养护“ 到智能精注的工业运维革命
  • 【芯片笔记】ADF4159
  • 详解Linux下多进程与多线程通信(一)
  • python:使用openpyxl库,实现excel表格的创建、查询(读取)、修改、插入数据
  • LVS负载均衡集群概述
  • 论文笔记:AnImitation Learning Approach for Cache Replacement
  • iOS高级开发工程师面试——架构设计