数据库中row_number()、rank()、dense_rank() 的区别
row_number的用途非常广泛,排序最好用它,它会为查询出来的每一行记录生成一个序号,依次排序且不会重复,注意使用row_number函数时必须要用over子句选择对某一列进行排序才能生成序号。
rank函数用于返回结果集的分区内每行的排名,行的排名是相关行之前的排名数加一。简单来说rank函数就是对查询出来的记录进行排名,与row_number函数不同的是,rank函数考虑到了over子句中排序字段值相同的情况,如果使用rank函数来生成序号,over子句中排序字段值相同的序号是一样的,后面字段值不相同的序号将跳过相同的排名号排下一个,也就是相关行之前的排名数加一,可以理解为根据当前的记录数生成序号,后面的记录依此类推。
dense_rank函数的功能与rank函数类似,dense_rank函数在生成序号时是连续的,而rank函数生成的序号有可能不连续。dense_rank函数出现相同排名时,将不跳过相同排名号,rank值紧接上一次的rank值。在各个分组内,rank()是跳跃排序,有两个第一名时接下来就是第四名,dense_rank()是连续排序,有两个第一名时仍然跟着第二名。
借助实例能更直观地理解:
假设现在有一张学生表student,学生表中有姓名、分数、课程编号。
select * from student;
现在需要按照课程对学生的成绩进行排序:
--row_number() 顺序排序 select name,course,row_number() over(partition by course order by score desc) rank from student;
--rank() 跳跃排序,如果有两个第一级别时,接下来是第三级别 select name,course,rank() over(partition by course order by score desc) rank from student;
--dense_rank() 连续排序,如果有两个第一级别时,接下来是第二级别 select name,course,dense_rank() over(partition by course order by score desc) rank from student;
取得每门课程的第一名:
--每门课程第一名只取一个: select * from (select name,course,row_number() over(partition by course order by score desc) rank from student) where rank=1; --每门课程第一名取所有: select * from (select name,course,dense_rank() over(partition by course order by score desc) rank from student) where rank=1; --每门课程第一名取所有: select * from (select name,course,rank() over(partition by course order by score desc) rank from student) where rank=1;
附:每门课程第一名取所有的其他方法(使用group by 而不是partition by):
select s.* from student s inner join(select course,max(score) as score from student group by course) c on s.course=c.course and s.score=c.score; --或者使用using关键字简化连接 select * from student s inner join(select course,max(score) as score from student group by course) c using(course,score);
关于Parttion by:
Parttion by关键字是Oracle中分析性函数的一部分,用于给结果集进行分区。它和聚合函数Group by不同的地方在于它只是将原始数据进行名次排列,能够返回一个分组中的多条记录(记录数不变),而Group by是对原始数据进行聚合统计,一般只有一条反映统计值的结果(每组返回一条)。
TIPS:
使用rank over()的时候,空值是最大的,如果排序字段为null, 可能造成null字段排在最前面,影响排序结果。
可以这样: rank over(partition by course order by score desc nulls last)
总结:
在使用排名函数的时候需要注意以下三点:
1、排名函数必须有 OVER 子句。
2、排名函数必须有包含 ORDER BY 的 OVER 子句。
3、分组内从1开始排序。
推荐阅读
-
SQL中distinct 和 row_number() over() 的区别及用法
-
数据库中聚簇索引与非聚簇索引的区别[图文]
-
利用ROW_NUMBER() OVER函数给SQL数据库中每一条记录分配行号的方法
-
Oracle中Union与Union All的区别(适用多个数据库)
-
SQL中distinct 和 row_number() over() 的区别及用法
-
rank() over,dense_rank() over,row_number() over的区别
-
Sqlserver数据库中char、varchar、nchar、nvarchar的区别及查询表结构
-
SQLSERVER 2005的ROW_NUMBER、RANK、DENSE_RANK的用法
-
面试|简单描述MySQL中,索引,主键,唯一索引,联合索引 的区别,对数据库的性能有什么影响(从读写两方面)
-
Oracle数据库中 call 和 exec的区别