掌握聚合最新动态了解行业最新趋势
API接口,开发服务,免费咨询服务

ROW_NUMBER() OVER()函数用法详解

在现代数据库管理中,SQL(Structured Query Language)扮演着至关重要的角色。随着SQL的发展,窗口函数(Window Functions)逐渐成为一种强大且灵活的工具,用于执行复杂的数据分析任务。其中,ROW_NUMBER() 是一种常用的窗口函数,它能够为每一行生成一个唯一的行号。本文将详细介绍 ROW_NUMBER() OVER() 函数的用法,包括其基本概念、语法结构、应用场景以及实际操作示例,帮助读者更好地理解和掌握这一功能。

一、ROW_NUMBER() OVER() 函数概述

1)定义

  1. 功能: ROW_NUMBER() OVER() 是一种窗口函数,用于为每一行生成一个唯一的行号。该行号通常按照某种排序规则递增。

  2. 语法: ROW_NUMBER() OVER ( [PARTITION BY column_list] ORDER BY sort_expression [ASC | DESC] )

2)特点

  1. 唯一性: ROW_NUMBER() 生成的行号是唯一的,不会重复。

  2. 灵活性: 可以结合 PARTITION BY 和 ORDER BY 子句,实现更复杂的行号分配逻辑。

二、ROW_NUMBER() OVER() 函数的基本语法

  1. 基本语法

格式:

ROW_NUMBER() OVER ( [PARTITION BY column_list] ORDER BY sort_expression [ASC | DESC] )

示例:

SELECT 
    employee_id, 
    salary,
    ROW_NUMBER() OVER (ORDER BY salary DESC) AS row_num
FROM employees;
  1. 参数说明

PARTITION BY: 用于将数据分成多个分区,每个分区内的行号重新开始计数。格式: PARTITION BY column_list

示例:

SELECT 
    employee_id, 
    department_id,
    ROW_NUMBER() OVER (PARTITION BY department_id ORDER BY salary DESC) AS row_num
FROM employees;

ORDER BY: 用于指定行号的排序规则。格式: ORDER BY sort_expression [ASC | DESC]

示例:

SELECT 
    employee_id, 
    salary,
    ROW_NUMBER() OVER (ORDER BY salary DESC) AS row_num
FROM employees;

三、ROW_NUMBER() OVER() 函数的应用场景

  1. 数据排名

场景: 常用于生成数据排名,例如销售排行榜、员工绩效排名等。

示例:

SELECT 
    product_name, 
    sales_amount,
    ROW_NUMBER() OVER (ORDER BY sales_amount DESC) AS rank
FROM sales_data;

解释: 上述查询按 sales_amount 降序排列,并生成销售排名。

  1. 数据去重

场景: 当需要去除重复记录时,可以先使用 ROW_NUMBER() 生成行号,然后过滤掉重复行。

示例:

WITH ranked_data AS (
    SELECT 
        customer_id, 
        order_date,
        ROW_NUMBER() OVER (PARTITION BY customer_id ORDER BY order_date DESC) AS row_num
    FROM orders
)
SELECT 
    customer_id, 
    order_date
FROM ranked_data
WHERE row_num = 1;

解释: 上述查询按 customer_id 分区,并在每个分区内按 order_date 降序排列,取出最新的订单日期。

  1. 数据分组

场景: 用于对数据进行分组处理,例如统计每个部门的员工数量。

示例:

SELECT 
    department_id, 
    COUNT(*) AS employee_count,
    ROW_NUMBER() OVER (ORDER BY COUNT(*) DESC) AS rank
FROM employees
GROUP BY department_id;

解释: 上述查询按 department_id 分组,并统计每个部门的员工数量,最后按员工数量降序排列生成排名。

  1. 生成序列号

场景: 在某些业务场景中,需要为数据生成唯一的序列号。

示例:

SELECT 
    employee_id, 
    ROW_NUMBER() OVER (ORDER BY employee_id) AS sequence_number
FROM employees;

解释: 上述查询按 employee_id 升序排列,并生成序列号。

  1. 统计排名

场景: 在比赛或竞赛中,需要统计参赛者的排名。

示例:

SELECT 
    competitor_id, 
    score,
    ROW_NUMBER() OVER (ORDER BY score DESC) AS rank
FROM competition_results;

解释: 上述查询按 score 降序排列,并生成排名。

  1. 生成唯一标识

场景: 在生成唯一标识时,可以使用 ROW_NUMBER() 结合其他列生成唯一标识。

示例:

SELECT 
    employee_id, 
    ROW_NUMBER() OVER (ORDER BY employee_id) AS unique_id
FROM employees;

解释: 上述查询按 employee_id 升序排列,并生成唯一标识。

  1. 统计分组

场景: 在统计分组时,可以使用 ROW_NUMBER() 结合 PARTITION BY 子句。

示例:

SELECT 
    department_id, 
    COUNT(*) AS employee_count,
    ROW_NUMBER() OVER (ORDER BY COUNT(*) DESC) AS rank
FROM employees
GROUP BY department_id;

解释: 上述查询按 department_id 分组,并统计每个部门的员工数量,最后按员工数量降序排列生成排名。

四、ROW_NUMBER() OVER() 函数的实际操作示例

  1. 基础用法

场景: 最简单的用法,不带任何子句。

示例:

SELECT 
    employee_id, 
    ROW_NUMBER() OVER (ORDER BY employee_id) AS row_num
FROM employees;

解释: 上述查询按 employee_id 升序排列,并生成行号。

  1. 结合 PARTITION BY 子句

场景: 按某一列进行分区,并在每个分区内生成行号。

示例:

SELECT 
    employee_id, 
    department_id,
    ROW_NUMBER() OVER (PARTITION BY department_id ORDER BY employee_id) AS row_num
FROM employees;

解释: 上述查询按 department_id 分区,并在每个分区内按 employee_id 升序排列,生成行号。

  1. 结合 ORDER BY 子句

场景: 按某一列进行排序,并生成行号。

示例:

SELECT 
    employee_id, 
    salary,
    ROW_NUMBER() OVER (ORDER BY salary DESC) AS row_num
FROM employees;

解释: 上述查询按 salary 降序排列,并生成行号。

  1. 结合 PARTITION BY 和 ORDER BY 子句

场景: 按某一列进行分区,并在每个分区内按另一列排序,生成行号。

示例:

SELECT 
    employee_id, 
    department_id,
    salary,
    ROW_NUMBER() OVER (PARTITION BY department_id ORDER BY salary DESC) AS row_num
FROM employees;

解释: 上述查询按 department_id 分区,并在每个分区内按 salary 降序排列,生成行号。

五、ROW_NUMBER() OVER() 函数的高级用法

  1. 多列排序

场景: 需要按多个列进行排序时,可以在 ORDER BY 子句中列出多个列。

示例:

SELECT 
    employee_id, 
    department_id,
    salary,
    ROW_NUMBER() OVER (PARTITION BY department_id ORDER BY salary DESC, employee_id ASC) AS row_num
FROM employees;

解释: 上述查询按 department_id 分区,并在每个分区内按 salary 降序和 employee_id 升序排列,生成行号。

  1. 窗口框架

场景: 使用窗口框架来限制行号的计算范围。

示例:

SELECT 
    employee_id, 
    salary,
    ROW_NUMBER() OVER (ORDER BY salary DESC ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW) AS row_num
FROM employees;

解释: 上述查询按 salary 降序排列,并生成行号,窗口框架从第一行到当前行。

  1. 窗口偏移

场景: 使用窗口偏移来计算行号。

示例:

SELECT 
    employee_id, 
    salary,
    ROW_NUMBER() OVER (ORDER BY salary DESC RANGE BETWEEN 1 PRECEDING AND 1 FOLLOWING) AS row_num
FROM employees;

解释: 上述查询按 salary 降序排列,并生成行号,窗口偏移范围为前一行到后一行。

ROW_NUMBER() OVER() 函数是 SQL 中非常实用的窗口函数之一,通过它可以方便地生成唯一的行号,实现数据排名、去重、分组等功能。本文详细介绍了 ROW_NUMBER() OVER() 函数的基本语法、应用场景、实际操作示例以及高级用法,涵盖了基础用法、结合 PARTITION BY 和 ORDER BY 子句的应用场景。通过本文的介绍,读者可以更好地理解并掌握 ROW_NUMBER() OVER() 函数的使用方法,从而在实际工作中灵活运用这一功能,提高数据处理的效率和准确性。希望本文提供的信息能够帮助读者更好地理解和应用 ROW_NUMBER() OVER() 函数,从而编写出更高效、更可靠的 SQL 查询。

声明:所有来源为“聚合数据”的内容信息,未经本网许可,不得转载!如对内容有异议或投诉,请与我们联系。邮箱:marketing@think-land.com

  • 全球天气预报

    支持全球约2.4万个城市地区天气查询,如:天气实况、逐日天气预报、24小时历史天气等

    支持全球约2.4万个城市地区天气查询,如:天气实况、逐日天气预报、24小时历史天气等

  • 购物小票识别

    支持识别各类商场、超市及药店的购物小票,包括店名、单号、总金额、消费时间、明细商品名称、单价、数量、金额等信息,可用于商品售卖信息统计、购物中心用户积分兑换及企业内部报销等场景

    支持识别各类商场、超市及药店的购物小票,包括店名、单号、总金额、消费时间、明细商品名称、单价、数量、金额等信息,可用于商品售卖信息统计、购物中心用户积分兑换及企业内部报销等场景

  • 涉农贷款地址识别

    涉农贷款地址识别,支持对私和对公两种方式。输入地址的行政区划越完整,识别准确度越高。

    涉农贷款地址识别,支持对私和对公两种方式。输入地址的行政区划越完整,识别准确度越高。

  • 人脸四要素

    根据给定的手机号、姓名、身份证、人像图片核验是否一致

    根据给定的手机号、姓名、身份证、人像图片核验是否一致

  • 个人/企业涉诉查询

    通过企业关键词查询企业涉讼详情,如裁判文书、开庭公告、执行公告、失信公告、案件流程等等。

    通过企业关键词查询企业涉讼详情,如裁判文书、开庭公告、执行公告、失信公告、案件流程等等。

0512-88869195
数 据 驱 动 未 来
Data Drives The Future