Mysql 8.0.2 中新增加了一个主要功能 - 窗口函数 window function
这个功能具体是解决什么问题?下面先看一个SQL查询的场景,看一下平时我们是怎么做的,然后再看一下如何使用窗口函数来更方便的解决
建一个简单的电影信息表,字段有:
ID
release_year(发行年份)
category_id(所属分类ID)
rating(评分)
CREATE TABLE films (
id int(11),
release_year int(11),
category_id int(11),
rating decimal(3,2)
)
插入测试数据
insert into films2 values
(1,2015,1,8.00),
(2,2015,2,8.50),
(3,2015,3,9.00),
(4,2016,2,8.20),
(5,2016,1,8.40),
(6,2017,2,7.00);
整体形式如下
查询每一年中的平均评分,要求每条记录后面都显示当年的平均评分
例如 2015 年,有3条记录,8.00, 8.50, 9.00 的平均分是 8.5,2016年有2条记录,平均分是 8.3,2017年有1条记录,平均分为 7.00
最终结果的形式如下:
我们可以使用子查询来计算各年的平均分,然后使用 join 把结果连接回去
SELECT
f.id, f.release_year,
f.rating, years.year_avg
FROM films f
LEFT JOIN (
SELECT f.release_year,
AVG(rating) AS year_avg
FROM films f
GROUP BY f.release_year
) years
ON f.release_year = years.release_year
是不是有点复杂,下面看下窗口函数的处理方式
window functions 是对一组数据进行计算,与使用 group by 时不同,不会进行单行的结果输出,而是与每条记录相关联
语法示例:
SELECT
function_name OVER ( window_definition )
FROM (...)
window_definition 是定义要计算的记录集合,就像是一个小窗口,在整体数据集合上显示出一部分
function_name 指定了对于窗口中的数据集合执行什么计算
回头看下上面的那个查询,需要计算每部电影所在年份的所有电影平均评分,下面使用窗口函数来处理
SELECT
f.id, f.release_year,
f.category_id, f.rating,
AVG(rating) OVER
(PARTITION BY release_year) AS year_avg
FROM films f
window_definition 部分使用了 PARTITION BY 从句,它告诉数据库把结果数据集合分割成更小的部分,把 release_year 相同的放在一起,函数 AVG(rating) 会对每个窗口数据进行计算,然后把结果放到每一行中
计算每部电影在所属年份中的评分排行位置
查询语句
SELECT
f.id, f.release_year,
f.category_id, f.rating,
RANK() OVER (PARTITION BY release_year
ORDER BY rating DESC) AS year_rank
FROM films f
window_definition 部分使用 PARTITION BY 来根据 release_year 划分窗口,使用 ORDER BY 在窗口内排序
RANK() 函数可以返回一行数据在本窗口中的位置
查询结果
查看每部电影在总排行榜中的位置
查询语句
SELECT
f.id, f.release_year,
f.category_id, f.rating,
RANK() OVER (ORDER BY rating DESC)
AS general_rank
FROM films f order by id
主语句中的 order by 保证了整个数据集的排序
window_definition 中没有使用 PARTITION BY,那么就是把整个结果集合当做一个窗口,ORDER BY 对窗口中的数据根据 rating 做降序排序,把得分最高的放前面
RANK() 函数取得每条记录在窗口中的位置
查询结果
窗口函数是 Mysql 8.0.2 中的高级特性,可以方便的执行聚合计算,而不用对结果集进行实际的聚合,大大增加了灵活性、可读性,更便于维护
有兴趣的同学可以提前学习下,可以使用 Mysql 8.0.2 的 Docker 镜像,很方便
参考资料:
原文来自:性能与架构
声明:所有来源为“聚合数据”的内容信息,未经本网许可,不得转载!如对内容有异议或投诉,请与我们联系。邮箱:marketing@think-land.com
涉农贷款地址识别,支持对私和对公两种方式。输入地址的行政区划越完整,识别准确度越高。
根据给定的手机号、姓名、身份证、人像图片核验是否一致
通过企业关键词查询企业涉讼详情,如裁判文书、开庭公告、执行公告、失信公告、案件流程等等。
IP反查域名是通过IP查询相关联的域名信息的功能,它提供IP地址历史上绑定过的域名信息。
结合权威身份认证的精准人脸风险查询服务,提升人脸应用及身份认证生态的安全性。人脸风险情报库,覆盖范围广、准确性高,数据权威可靠。