当前位置: 首页 > news >正文

MySQL 中如何解决深度分页的问题? MySQL中 join、inner join、left join、right join区别

MySQL 中如何解决深度分页的问题?

在 MySQL 中解决深度分页问题的核心思路是减少扫描的数据量,尤其是避免通过 LIMIT offset, size 导致的大范围数据扫描。以下是三种优化方法及其原理、适用场景和注意事项:


1. 子查询 + 覆盖索引(延迟关联)

原理

  • 先通过覆盖索引(如二级索引 (name, id))快速定位目标页的起始 id,再通过主键索引回表查询数据。
  • 子查询只需扫描二级索引,体积小且有序,能高效跳过 offset 行,获取起始 id
  • 主查询通过 id >= [子查询结果] 直接定位数据,避免全表扫描。

示例 SQL

SELECT * FROM mianshiya 
WHERE name = 'yupi' AND id >= (
    SELECT id FROM mianshiya 
    WHERE name = 'yupi' 
    ORDER BY id LIMIT 99999990, 1
)
ORDER BY id LIMIT 10;

或使用 JOIN 优化:

SELECT * FROM mianshiya 
INNER JOIN (
    SELECT id FROM mianshiya 
    WHERE name = 'yupi' 
    ORDER BY id LIMIT 99999990, 10
) AS tmp ON mianshiya.id = tmp.id;

关键点

  • 必须创建联合索引 (name, id),确保子查询直接利用索引有序性,避免临时排序(filesort)。
  • 主查询的 name 条件可省略(若子查询结果 id 对应的 name 必为 'yupi'),但需权衡数据变更风险。

2. 记录最大 ID(游标分页)

原理

  • 每次分页返回当前页的最大 id,下页查询时通过 WHERE id > max_id LIMIT size 跳过已读数据。
  • 仅扫描目标数据(size 行),时间复杂度稳定为 O(size),性能极佳。

适用场景

  • 连续分页(如“下一页”),不支持随机跳页。
  • 数据按主键或有序字段分页(如 ORDER BY id)。

示例 SQL

-- 第一页
SELECT * FROM mianshiya WHERE name = 'yupi' ORDER BY id LIMIT 10;
-- 后续页(假设上一页最大 id 为 100)
SELECT * FROM mianshiya WHERE name = 'yupi' AND id > 100 ORDER BY id LIMIT 10;

注意事项

  • 若数据删除或新增可能导致少量重复或遗漏,需业务容忍。
  • 需前端配合传递 max_id,不可直接跳页。

3. Elasticsearch 优化

原理

  • 将数据同步到 Elasticsearch,利用其分布式特性加速搜索。
  • 通过 search_after 参数实现游标分页,类似记录 max_id 方法,避免深分页性能问题。

ES 分页示例

{
  "query": { "match": { "name": "yupi" } },
  "sort": [{ "id": "asc" }],
  "size": 10,
  "search_after": [100]  -- 上一页最后一条记录的排序值
}

ES 注意事项

  • 默认限制 from + size <= 10000,深度分页需改用 search_afterscroll
  • search_after 需基于唯一排序字段,且仅支持连续分页。

其他优化思路

  • 业务限制:禁止深度跳页(如最多展示前 100 页)。
  • 预计算分页位置:按时间或分段存储分页起始 ID(如每 1000 页记录一个起始 ID)。
  • 分区表:按时间或范围分区,减少单次扫描数据量。

总结

方法优点缺点适用场景
子查询 + 覆盖索引支持跳页,通用性强依赖联合索引设计需频繁分页且允许跳页
记录最大 ID性能最优,复杂度低仅支持连续分页连续分页(如瀑布流)
Elasticsearch适合复杂搜索,分布式性能好维护成本高,ES 需额外学习高并发搜索+分页场景

核心要点

  • 索引设计是优化基础,确保覆盖索引和排序字段匹配。
  • 权衡业务需求,优先选择游标分页(记录 max_id)或延迟关联(子查询)。
  • 搜索引擎适用于复杂查询,但引入额外组件需评估成本。

MySQL中 join、inner join、left join、right join区别

在 MySQL 中,JOIN 操作用于将多个表中的数据关联起来。以下是 INNER JOINLEFT JOINRIGHT JOIN 的核心区别和用法总结,帮助你快速分清它们:


1. INNER JOIN(内连接)

  • 作用:只返回两个表中完全匹配的行。

  • 结果:仅包含两个表中都存在关联键值的行。

  • 语法

    SELECT * 
    FROM 表A
    INNER JOIN 表B ON 表A.= 表B.;
    
  • 示例

    • 表A(员工表)和表B(部门表)通过 department_id 关联。
    • 结果:只显示有部门的员工信息,无部门无员工的数据会被过滤掉。

2. LEFT JOIN(左外连接)

  • 作用:返回左表(LEFT JOIN 左侧的表)的所有行,即使右表没有匹配。

  • 结果:左表所有数据 + 右表匹配的数据(无匹配时右表字段为 NULL)。

  • 语法

    SELECT * 
    FROM 表A
    LEFT JOIN 表B ON 表A.= 表B.;
    
  • 示例

    • 表A(员工表)LEFT JOIN 表B(部门表)。
    • 结果:显示所有员工信息,即使员工没有部门(部门字段为 NULL)。

3. RIGHT JOIN(右外连接)

  • 作用:返回右表(RIGHT JOIN 右侧的表)的所有行,即使左表没有匹配。

  • 结果:右表所有数据 + 左表匹配的数据(无匹配时左表字段为 NULL)。

  • 语法

    SELECT * 
    FROM 表A
    RIGHT JOIN 表B ON 表A.= 表B.;
    
  • 示例

    • 表A(员工表)RIGHT JOIN 表B(部门表)。
    • 结果:显示所有部门信息,即使部门没有员工(员工字段为 NULL)。

4. JOIN(默认是 INNER JOIN)

  • 说明:在 MySQL 中,直接写 JOIN 等价于 INNER JOIN

    SELECT * 
    FROM 表A
    JOIN 表B ON 表A.= 表B.; -- 等同于 INNER JOIN
    

对比总结

类型行为适用场景
INNER JOIN仅返回两个表匹配的行需要精确匹配的数据(如订单和商品)
LEFT JOIN返回左表全部数据 + 右表匹配的数据(右表无匹配则为 NULL保留左表全部数据(如所有员工信息)
RIGHT JOIN返回右表全部数据 + 左表匹配的数据(左表无匹配则为 NULL保留右表全部数据(如所有部门信息)

关键注意事项

  1. 方向性LEFT JOINRIGHT JOIN 的方向取决于表的书写顺序。
    • LEFT JOIN 以左表为主,RIGHT JOIN 以右表为主。
  2. 过滤条件
    • LEFT JOIN 中,若在 WHERE 子句中对右表字段过滤(如 WHERE 表B.键 IS NULL),会筛选出仅存在于左表但右表无匹配的行。
  3. 性能
    • INNER JOIN 通常效率更高,因为它涉及的数据量更小。
    • LEFT/RIGHT JOIN 可能因处理 NULL 值而略慢,尤其是在大表中。

示例演示

数据准备
-- 员工表(employees)
+-------------+-------+---------------+
| employee_id | name  | department_id |
+-------------+-------+---------------+
| 1           | 张三  | 101           |
| 2           | 李四  | 102           |
| 3           | 王五  | NULL          |
+-------------+-------+---------------+

-- 部门表(departments)
+---------------+-----------------+
| department_id | department_name |
+---------------+-----------------+
| 101           | 技术部          |
| 102           | 市场部          |
| 103           | 财务部          |
+---------------+-----------------+
查询结果对比
  1. INNER JOIN(匹配数据):

    SELECT * 
    FROM employees
    INNER JOIN departments 
      ON employees.department_id = departments.department_id;
    

    结果

    | 1 | 张三 | 101 | 101 | 技术部 |
    | 2 | 李四 | 102 | 102 | 市场部 |
    
  2. LEFT JOIN(保留所有员工):

    SELECT * 
    FROM employees
    LEFT JOIN departments 
      ON employees.department_id = departments.department_id;
    

    结果

    | 1 | 张三 | 101 | 101 | 技术部 |
    | 2 | 李四 | 102 | 102 | 市场部 |
    | 3 | 王五 | NULL| NULL| NULL   | -- 员工无部门,右表字段为 NULL
    
  3. RIGHT JOIN(保留所有部门):

    SELECT * 
    FROM employees
    RIGHT JOIN departments 
      ON employees.department_id = departments.department_id;
    

    结果

    | 1 | 张三 | 101 | 101 | 技术部 |
    | 2 | 李四 | 102 | 102 | 市场部 |
    | NULL| NULL| NULL| 103 | 财务部 | -- 部门无员工,左表字段为 NULL
    

总结

  • INNER JOIN:精确匹配,适合需要严格关联的场景。
  • LEFT JOIN:保留左表全部数据,适合主从表查询(如“所有员工及其部门”)。
  • RIGHT JOIN:保留右表全部数据,使用较少(通常用 LEFT JOIN 调换表顺序替代)。

相关文章:

  • 解决 ERROR 1130 (HY000): Host is not allowed to connect to this MySQL server
  • springboot、deepseek4j、bge-m3和milvus
  • 关于“你对 Spring Cloud 的理解”详细讲解?
  • bean的管理-03.第三方bean
  • 第8章:流式海啸:数据重构
  • Yolo各个系列的模型、ResNet、Pyrimid network、VGG、PointNet、mobilenet模型
  • ES6模块化详解:导入与导出方式
  • 常用 ADB 命令汇总
  • Starrocks入门(二)
  • 新一代书生·浦语大模型(InternLM3)沐曦训推实践
  • 大型语言模型技术对比:阿里Qwen qwq、DeepSeek R1、OpenAI o3与Grok 3
  • 网站漏洞安全测试 具体渗透思路分析
  • ollama和open-webui部署ds
  • conda常用命令
  • git - study
  • HIVE数据类型
  • Three.js 入门(GUI可视化改变三维场景)
  • DNS的解析流程
  • 伊吖学C笔记(1、二进制、补码、小数)
  • 深入剖析:自定义实现C语言中的atoi函数
  • 南宁做网站开发的公司/百度推广首页登录
  • 南山电商网站建设/营销策划
  • 专业建站服务公司/全网引流推广 价格
  • 如何用织梦做网站详细教程/抖音推广佣金平台
  • 网站手机版怎么做/端口扫描站长工具
  • 网站留言板作用/百度seo新算法