当前位置: 首页 > news >正文

MySQL统计信息

1. 什么是统计信息?

统计信息就像是数据库的"地图",它告诉优化器:

  • 每个表有多大(有多少行数据)

  • 每个索引的"区分度"(有多少不同的值)

  • 数据分布情况(哪些值出现频率高)

2. 为什么需要统计信息?

想象你要找一本图书馆的书:

  • 没有统计信息:盲目地在每个书架搜索

  • 有统计信息:直接去最可能存放的书架查找

二、统计信息核心内容全景图

统计信息类型存储位置更新方式影响范围
表大小/行数data_dictionary自动/手动ANALYZE全表扫描成本计算
索引基数(Cardinality)mysql.innodb_index_stats自动/手动ANALYZE索引选择
直方图(Histogram)column_statistics手动ANALYZE TABLE等值查询优化
索引深度内存计算自动范围查询效率

 

三、统计信息全生命周期管理

1. 创建阶段

 

-- 创建表时指定统计信息策略
CREATE TABLE users (
    id INT PRIMARY KEY,
    name VARCHAR(100),
    INDEX (name)
) STATS_PERSISTENT=1 STATS_AUTO_RECALC=1;

 

2. 更新机制

自动更新触发条件

  • 表中数据变化超过10%(默认阈值)

  • 第一次打开表时

  • 执行SHOW TABLE STATUS时(某些版本)

手动更新方法

-- 标准语法
ANALYZE TABLE users;

-- 更新直方图统计(MySQL 8.0+)
ANALYZE TABLE users UPDATE HISTOGRAM ON name WITH 32 BUCKETS;

 3. 监控方法

-- 检查统计信息时效性
SELECT 
    table_name,
    update_time,
    CONCAT(ROUND(data_length/1024/1024,2),'MB') AS size,
    IF(DATEDIFF(NOW(),update_time)>7,'⚠️过期','✅正常') AS status
FROM 
    information_schema.tables
WHERE 
    table_schema=DATABASE();

-- 查看索引统计详情
SELECT * FROM mysql.innodb_index_stats WHERE table_name='users';

四、生产环境最佳实践

1. 参数配置建议

[mysqld]
# 启用持久化统计(重启不丢失)
innodb_stats_persistent=ON
# 自动重新计算统计
innodb_stats_auto_recalc=ON
# 增加采样页面提高准确性
innodb_stats_persistent_sample_pages=32

2. 维护方案

日常维护

-- 每周维护脚本示例
SET @db = DATABASE();
SELECT CONCAT('ANALYZE TABLE ', table_name, ';') 
FROM information_schema.tables 
WHERE table_schema = @db 
  AND DATEDIFF(NOW(),update_time) > 7
INTO OUTFILE '/tmp/analyze_tables.sql';
SOURCE /tmp/analyze_tables.sql;

大表特殊处理

# 使用pt-table-sync分批分析
pt-table-sync --analyze h=localhost,D=dbname,t=large_table

五、常见问题解决方案

1. 统计信息不准的症状

  • 执行计划突然变差

  • 相同的查询有时快有时慢

  • EXPLAIN显示预估行数与实际严重不符

2. 紧急处理方法

-- 立即刷新问题表的统计信息
FLUSH TABLE users;
ANALYZE TABLE users;

-- 强制使用指定索引(临时方案)
SELECT /*+ INDEX(users name_idx) */ * FROM users WHERE name LIKE 'A%';

3. 自动化监控方案

-- 创建监控事件
CREATE EVENT monitor_stats
ON SCHEDULE EVERY 1 DAY
DO
BEGIN
    DECLARE cnt INT;
    SELECT COUNT(*) INTO cnt FROM information_schema.tables 
    WHERE table_schema=DATABASE() AND DATEDIFF(NOW(),update_time)>7;
    
    IF cnt > 0 THEN
        -- 发送报警邮件或记录日志
        CALL send_alert(CONCAT(cnt, ' tables need analyze'));
    END IF;
END;

六、可视化学习工具

  1. 统计信息查看

    -- 使用MySQL Workbench可视化统计信息
    -- 右键表 → Table Inspector → Indexes/Statistics
  2. 执行计划对比

    -- 更新统计前后对比
    EXPLAIN FORMAT=TREE SELECT * FROM users WHERE age > 30;
    ANALYZE TABLE users;
    EXPLAIN FORMAT=TREE SELECT * FROM users WHERE age > 30;

http://www.dtcms.com/a/111238.html

相关文章:

  • JS dom修改元素的style样式属性
  • 删除Linux服务器上多余的系统启动项,并重装Ubuntu系统
  • Java 连接 WebSocket 入门教程
  • 【Web 服务器】的工作原理
  • 第十八节课:Python编程基础复习
  • wx206基于ssm+vue+uniapp的优购电商小程序
  • NLP高频面试题(三十五)——LLaMA / ChatGLM / BLOOM的区别
  • AI + 慢病逆转 1
  • USB传输(Transaction)过程简介
  • swift-oc和swift block和代理
  • ElasticSearch JavaRestClient查询之高亮显示
  • JS用ES6和ES5分别实现:8字节长整数和字节数组的互转
  • 软考系统架构师 — 4 嵌入式软件
  • H.266/VVC SCC技术学习:块差分脉冲编码调整(block differential pulse coded modulation, BDPCM)
  • 生信入门:专栏概要与内容目录
  • AI算法大全初见面
  • Redisson使用详解
  • 《Maven高级应用:继承聚合设计与私服Nexus实战指南》
  • 嵌入式学习笔记——SPI协议
  • “一路有你”公益行携手《东方星动》走进湖南岳阳岑川镇中心小学
  • AI Agent设计模式二:Parallelization
  • 【新能源汽车整车动力学模型深度解析:面向MATLAB/Simulink仿真测试工程师的硬核指南】
  • PyTorch:解锁AI新时代的钥匙
  • Python基于时间序列分析的降雨量预测系统的设计与实现【附源码、文档说明】
  • 一周学会Pandas2 Python数据处理与分析-Jupyter Notebook安装
  • C++类的特殊成员函数:构造、拷贝构造与析构函数详解
  • F#语言的折线图
  • Prolog语言的强化学习
  • MySQL 知识点详解(索引、存储引擎、事务、锁机制、优化)
  • 当机器学习遇见购物车分析:FP-Growth算法全解析