当前位置: 首页 > news >正文

SQL关键字三分钟入门:RANK() —— 窗口函数

在数据分析过程中,我们经常需要对数据进行排序,并根据某些条件给记录分配排名。例如:

  • 按照销售额为销售人员排名;
  • 根据考试成绩对学生进行排序;
  • 依据访问量给网站页面排序。

这时候就需要用到 SQL 中非常强大的窗口函数 —— RANK()

它可以帮助我们轻松地为查询结果集中的每一行分配一个排名,特别适合处理涉及排序和分组的数据分析任务。


 什么是 RANK()?

RANK() 是 SQL 中用于计算分区或整个结果集中行的排名的窗口函数。它会根据指定的排序规则为每条记录分配一个排名值,允许存在并列排名(即相同的值会有相同的排名,但接下来的排名会跳过相应的数字)。

你可以把它理解为:“按照某个标准给每条记录打上排名标签”。


 基本语法

SELECT column1, column2, ..., RANK() OVER ([PARTITION BY partition_column]ORDER BY sort_column [ASC|DESC], ...
) AS rank_number
FROM table_name;
  • PARTITION BY(可选):定义如何将数据划分为不同的分区(类似于 GROUP BY),每个分区独立进行排名。
  • ORDER BY:指定用于决定排名顺序的列及其方向(升序或降序)。

 示例讲解

假设我们有一个 sales 表,记录了销售人员的业绩信息:

employee_idnamesales_amount
1张三5000
2李四3000
3王五4000
4赵六4000
5孙七6000

 示例1:按销售额对所有员工进行排名

SELECT name, sales_amount,
RANK() OVER (ORDER BY sales_amount DESC) AS rank_number
FROM sales;
结果:
namesales_amountrank_number
孙七60001
张三50002
王五40003
赵六40003
李四30005

 注意:因为王五和赵六的销售额相同,他们的排名都是3,而下一位李四的排名则跳到了5(而不是4)。


 示例2:按部门对员工进行排名(使用 PARTITION BY)

假设我们增加了一个 department 列来表示员工所属的部门:

employee_idnamedepartmentsales_amount
1张三销售部5000
2李四销售部3000
3王五技术部4000
4赵六技术部4000
5孙七销售部6000
SELECT name, department, sales_amount,
RANK() OVER (PARTITION BY department ORDER BY sales_amount DESC) AS rank_number
FROM sales;
结果:
namedepartmentsales_amountrank_number
孙七销售部60001
张三销售部50002
李四销售部30003
王五技术部40001
赵六技术部40001

 这里我们按部门进行了划分,然后在每个部门内部根据销售额进行排名。


 示例3:结合其他聚合函数使用

有时候你可能还需要同时计算一些汇总信息,比如总销售额、平均销售额等。下面的例子展示了如何同时显示排名和销售总额:

SELECT name, sales_amount,
SUM(sales_amount) OVER () AS total_sales,
RANK() OVER (ORDER BY sales_amount DESC) AS rank_number
FROM sales;
结果:
namesales_amounttotal_salesrank_number
孙七6000220001
张三5000220002
王五4000220003
赵六4000220003
李四3000220005

 注意

对比项使用建议
并列排名如果多个记录有相同的排序值,它们会被赋予相同的排名,且下一个排名会跳过相应的数字
不同的排名函数DENSE_RANK():与 RANK() 类似,但不会跳过排名数字
ROW_NUMBER():总是给出连续的排名数字,即使有相同的排序值
性能优化尽量减少 PARTITION BY 的范围以提高性能
数据一致性在执行复杂的排名操作时,确保数据的一致性和准确性

 总结对比表

场景SQL 示例
按单一条件排名SELECT ..., RANK() OVER (ORDER BY sales_amount DESC) AS rank FROM sales;
按部门内条件排名SELECT ..., RANK() OVER (PARTITION BY department ORDER BY sales_amount DESC) AS rank FROM sales;
结合其他聚合函数使用SELECT ..., SUM(sales_amount) OVER () AS total_sales, RANK() OVER (ORDER BY sales_amount DESC) AS rank FROM sales;

相关文章:

  • 深入解析 Electron 核心模块:构建跨平台桌面应用的关键
  • zookeeper Curator(1):认识zookeeper和操作命令
  • 【大数据】HDFS分布式 机架感知
  • 2.2.3、CAN总线-位时间特性、中断
  • 删除排序数组中的重复项 II
  • 搭建Flink分布式集群
  • nginx目录美化
  • OD 算法题 B卷【数字序列比大小】
  • C++法则20:元编程是 C++ 中实现零开销抽象的核心工具之一,但并非所有抽象都能通过它实现零开销。
  • 人大金仓数据库jdbc连接jar包kingbase8-8.6.0.jar驱动包最新版下载(不需要积分)
  • 【世纪龙科技】新能源汽车动力电池总成装调与检修教学软件
  • ADVANCED INTELLIGENT SYSTEMS 东京大学仿生人类手指机器人,实现“皮肤”补水!
  • VS Code 配置本地 Dev Container
  • stream使用案例
  • 代码随想录算法训练营day18
  • 什么是 Paxos和Raft
  • 信号处理学习——文献精读与code复现之TFN——嵌入时频变换的可解释神经网络(下)
  • 商业秘密中经营信息的法律保护探析——以客户名册为例
  • 开源3D 动态银河系特效:Vue 与 THREE.JS 的奇幻之旅
  • 如何在FastAPI中打造坚不可摧的Web安全防线?