当前位置: 首页 > news >正文

【MySQL】索引运算与NULL值问题详解:索引字段应尽量 NOT NULL ,NULL值不能参与部分索引运算

索引运算与NULL值问题详解

不能参与的"部分索引运算"指什么?

这里的"部分索引运算"指的是索引列在某些特定操作或条件下无法被MySQL优化器有效利用的情况,特别是当字段包含NULL值时。主要包括以下几种情况:

1. 比较运算中的问题

-- 当字段可能为NULL时,以下比较运算可能无法使用索引:
WHERE indexed_column = NULL  -- 错误写法,应该用 IS NULL
WHERE indexed_column != 'value'  -- 包含NULL的记录会被排除

2. 数学运算和函数

-- 对索引列进行运算会导致索引失效
WHERE indexed_column + 1 = 10  -- 索引失效
WHERE YEAR(indexed_date_column) = 2023  -- 索引失效

3. 范围查询中的边界问题

-- NULL值在范围查询中的特殊行为
WHERE indexed_column BETWEEN 10 AND 20  -- NULL值不会被包含

为什么NULL值对索引不利?

1. 存储结构差异

  • B+树索引中NULL值会被特殊处理,通常存储在索引的最左侧或最右侧
  • 这使得索引结构变得复杂,影响查询效率

2. 统计信息不准确

  • MySQL的查询优化器依赖索引统计信息做决策
  • NULL值的特殊性质使得统计信息更难准确计算

3. 比较运算的特殊性

  • 在SQL中,NULL = NULL 的结果是UNKNOWN而不是TRUE
  • 这种三值逻辑(TRUE/FALSE/UNKNOWN)增加了优化难度

实际代码演示

示例1:NULL值导致索引失效

-- 创建测试表
CREATE TABLE products (id INT PRIMARY KEY,name VARCHAR(100),price DECIMAL(10,2),discount DECIMAL(10,2),  -- 允许NULLINDEX idx_price (price),INDEX idx_discount (discount)
);-- 查询1:使用索引(非NULL列)
EXPLAIN SELECT * FROM products WHERE price = 19.99;
-- type: ref, key: idx_price-- 查询2:索引可能失效(NULL列)
EXPLAIN SELECT * FROM products WHERE discount = 0.5;
-- 如果discount列有很多NULL值,优化器可能选择全表扫描

示例2:IS NULL的特殊处理

-- 查询3:IS NULL查询
EXPLAIN SELECT * FROM products WHERE discount IS NULL;
-- 即使有索引,IS NULL查询效率通常较低
-- type: ref_or_null(特殊访问方法)

示例3:NOT NULL优化

-- 优化后的表结构
CREATE TABLE products_optimized (id INT PRIMARY KEY,name VARCHAR(100),price DECIMAL(10,2) NOT NULL DEFAULT 0,discount DECIMAL(10,2) NOT NULL DEFAULT 0,  -- 不允许NULLINDEX idx_price (price),INDEX idx_discount (discount)
);-- 查询效率更高
EXPLAIN SELECT * FROM products_optimized WHERE discount = 0.5;
-- type: ref, key: idx_discount

最佳实践建议

  1. 尽量定义NOT NULL约束

    CREATE TABLE users (id INT NOT NULL,name VARCHAR(100) NOT NULL DEFAULT ''
    );
    
  2. 为NULL列设置合理的默认值

    ALTER TABLE products MODIFY discount DECIMAL(10,2) NOT NULL DEFAULT 0;
    
  3. 避免对索引列使用函数或运算

    -- 不好的写法
    SELECT * FROM products WHERE YEAR(created_at) = 2023;-- 好的写法
    SELECT * FROM products 
    WHERE created_at BETWEEN '2023-01-01' AND '2023-12-31';
    
  4. 使用IS NULL的特殊处理

    -- 如果必须查询NULL值,考虑使用覆盖索引
    CREATE INDEX idx_discount_covering ON products(discount, name);
    
  5. 监控NULL值比例

    -- 检查NULL值占比
    SELECT COUNT(*) AS total,SUM(CASE WHEN discount IS NULL THEN 1 ELSE 0 END) AS null_count,(SUM(CASE WHEN discount IS NULL THEN 1 ELSE 0 END) / COUNT(*)) AS null_ratio
    FROM products;
    

通过避免NULL值和注意索引运算的限制,可以显著提高索引利用率和查询性能。


https://github.com/0voice

相关文章:

  • 【ESP32|音频】一文读懂WAV音频文件格式【详解】
  • HTTP 2.0 协议特性详解
  • Nginx Http配置整理
  • MQTT客户端核心架构解析:clients.h源码深度解读
  • 关于Java集合中对象字段的不同排序实现方式
  • 是德科技E5080B网络分析仪深度评测:5G/车载雷达测试实战指南
  • 小程序录音授权逻辑
  • 立创·泰山派RK3566开发板调试MIPI LCD
  • 自已实现一个远程打印方案 解决小程序或APP在外面控制本地电脑打印实现
  • 停止回答 docker启动redis
  • 青少年编程与数学 02-016 Python数据结构与算法 26课题、生物信息学算法
  • XC6SLX100T-2FGG484I 赛灵思 XilinxFPGA Spartan-6
  • 抽样信号——Sa函数sinc函数
  • java聊天室案例改进(建立与数据库的连接)
  • Chrome漏洞可窃取数据并获得未经授权的访问权限
  • rac环境下,增加一个控制文件controlfile
  • 从技术本质到未来演进:全方位解读Web的过去、现在与未来
  • Git完全指南:从入门到精通版本控制 ------- Git Flow(10)
  • TDengine 语言连接器(PHP)
  • 用 MongoIndexStore 实现对话存档和恢复 实现“多用户、多对话线程”场景(像一个 ChatGPT 对话列表那样)
  • 齐白石精品在波士顿展出,“白石画屋”呈现水墨挥洒
  • AI观察|从万元到百万元,DeepSeek一体机江湖混战
  • 他站在当代思想的地平线上,眺望浪漫主义的余晖
  • “海豚音”依旧,玛丽亚·凯莉本周来沪开唱
  • 普京提议恢复直接谈判,泽连斯基:望俄明日停火,乌愿谈判
  • 航行警告:渤海海峡黄海北部执行军事任务,禁止驶入