当前位置: 首页 > news >正文

SQL关键字三分钟入门:ROW_NUMBER() —— 窗口函数为每一行编号

在进行数据分析时,我们常常需要为查询结果集中的每条记录生成一个唯一的序号或行号。例如:

  • 为每位员工按照入职时间排序并编号;
  • 按照订单金额对订单进行排序,并给每个订单分配一个顺序编号;
  • 在分组数据内为每条记录编号。

这时候就需要使用 SQL 中非常有用的窗口函数 —— ROW_NUMBER()

它可以帮助我们轻松地为查询结果集中的每一行分配一个独一无二的行号,特别适合处理涉及排序和分组的数据分析任务。


 什么是 ROW_NUMBER()?

ROW_NUMBER() 是 SQL 中用于为分区或整个结果集中的行生成唯一行号的窗口函数。它会根据指定的排序规则为每条记录分配一个连续的行号,即使存在相同的值也不会导致行号跳过。

你可以把它理解为:“按照某个标准给每条记录打上独一无二的行号标签”。


 基本语法

SELECT column1, column2, ..., 
ROW_NUMBER() OVER ([PARTITION BY partition_column]ORDER BY sort_column [ASC|DESC], ...
) AS row_num
FROM table_name;
  • PARTITION BY(可选):定义如何将数据划分为不同的分区(类似于 GROUP BY),每个分区独立进行编号。
  • ORDER BY:指定用于决定行号顺序的列及其方向(升序或降序)。

 示例讲解

假设我们有一个 employees 表,记录了员工的信息:

employee_idnamehire_date
1张三2020-06-01
2李四2019-05-23
3王五2021-07-15
4赵六2020-08-10
5孙七2018-03-12

 示例1:按入职日期为所有员工编号

SELECT name, hire_date,
ROW_NUMBER() OVER (ORDER BY hire_date ASC) AS row_num
FROM employees;
结果:
namehire_daterow_num
孙七2018-03-121
李四2019-05-232
张三2020-06-013
赵六2020-08-104
王五2021-07-155

 注意:这里我们按入职日期进行了升序排列,并为每位员工分配了一个连续的行号。


 示例2:按部门对员工进行编号(使用 PARTITION BY)

假设我们增加了一个 department 列来表示员工所属的部门:

employee_idnamedepartmenthire_date
1张三销售部2020-06-01
2李四销售部2019-05-23
3王五技术部2021-07-15
4赵六技术部2020-08-10
5孙七销售部2018-03-12
SELECT name, department, hire_date,
ROW_NUMBER() OVER (PARTITION BY department ORDER BY hire_date ASC) AS row_num
FROM employees;
结果:
namedepartmenthire_daterow_num
孙七销售部2018-03-121
李四销售部2019-05-232
张三销售部2020-06-013
王五技术部2021-07-151
赵六技术部2020-08-102

 这里我们按部门进行了划分,然后在每个部门内部根据入职日期进行编号。


 示例3:结合其他聚合函数使用

有时候你可能还需要同时计算一些汇总信息,比如总人数、平均入职年限等。下面的例子展示了如何同时显示编号和部门总人数:

SELECT name, department, hire_date,
ROW_NUMBER() OVER (PARTITION BY department ORDER BY hire_date ASC) AS row_num,
COUNT(*) OVER (PARTITION BY department) AS total_employees_in_dept
FROM employees;
结果:
namedepartmenthire_daterow_numtotal_employees_in_dept
孙七销售部2018-03-1213
李四销售部2019-05-2323
张三销售部2020-06-0133
王五技术部2021-07-1512
赵六技术部2020-08-1022

注意

对比项使用建议
唯一行号即使有相同的排序值,ROW_NUMBER() 也会为每条记录分配一个唯一的行号
不同的排名函数RANK():允许并列排名,但会导致行号跳跃
DENSE_RANK():与 RANK() 类似,但不会跳过行号
性能优化尽量减少 PARTITION BY 的范围以提高性能
数据一致性在执行复杂的编号操作时,确保数据的一致性和准确性

 总结对比表

场景SQL 示例
按单一条件编号SELECT ..., ROW_NUMBER() OVER (ORDER BY hire_date ASC) AS row_num FROM employees;
按部门内条件编号SELECT ..., ROW_NUMBER() OVER (PARTITION BY department ORDER BY hire_date ASC) AS row_num FROM employees;
结合其他聚合函数使用SELECT ..., ROW_NUMBER() OVER (PARTITION BY department ORDER BY hire_date ASC) AS row_num, COUNT(*) OVER (PARTITION BY department) AS total_employees_in_dept FROM employees;

希望这篇简短的指南帮助你快速了解了 ROW_NUMBER() 窗口函数的强大功能。

相关文章:

  • 深度学习-分类
  • Sensodrive SensoJoint机器人力控关节模组抗振动+Sensodrive力反馈系统精准对接
  • web3 docs
  • 力扣第73题-矩阵置零
  • Java面向对象(一)
  • 对话式数据分析与Text2SQL Agent产品可行性分析思考
  • Python 数据分析:numpy,抽提,整数数组索引
  • 从单体架构到微服务:微服务架构演进与实践
  • 如何解决电脑windows蓝屏问题
  • 叉车考试真题(含答案)pdf下载
  • Rust宏和普通函数的区别
  • 心理测评app在线预约系统框架设计
  • 【HarmonyOS Next之旅】DevEco Studio使用指南(三十八) -> 构建HAR
  • ByteMD+CozeAPI+Coze平台Agent+Next搭建AI辅助博客撰写平台(逻辑清楚,推荐!)
  • 如何修改discuz文章标题字数限制 修改成255
  • Spring MVC参数解析:深入剖析415异常与@RequestBody处理机制问题场景
  • 创客匠人:创始人 IP 打造引领知识变现新路径​
  • 【HarmonyOS NEXT】跳转到华为应用市场进行应用下载并更新
  • Cesium快速入门到精通系列教程十一:Cesium1.74中高性能渲染上万Polyline
  • TDengine 如何打破工业实时数据库势力边界?