【数据仓库面试题合集④】SQL 性能调优:面试高频场景 + 调优策略解析
随着业务数据规模的持续增长,SQL 查询的执行效率直接影响到数据平台的稳定性与数据产出效率。因此,在数据仓库类岗位的面试中,SQL 性能调优常被作为重点考察内容。
本篇将围绕常见 SQL 调优问题,结合实际经验,整理出高频面试题与答题参考,助你在面试中游刃有余。
🎯 高频面试题 + 答案参考
1. 你是如何排查一个慢 SQL 的?有哪些常见思路?
✅ 回答参考:
排查 SQL 性能问题一般分以下几个步骤:
-
确认执行计划(Explain):找出是否有全表扫描、笛卡尔积、数据倾斜等问题;
-
查看扫描行数和实际返回数据量:确认是否存在无谓的扫描;
-
检查过滤条件、连接条件是否能命中索引 / 分区 / 分桶键;
-
关注数据量较大的表,是否合理建模或做过预聚合;
-
观察是否存在数据倾斜节点(特别在 Spark、Hive 中);
-
确认并发压力 / 资源不足导致的慢执行;
工具包括:EXPLAIN
、Spark UI
、DolphinScheduler 日志
、资源监控平台等。