欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

sql server如何利用开窗函数over()进行分组统计

程序员文章站 2022-04-14 11:35:20
这是一道常见的面试题,在实际项目中经常会用到。 需求:求出以产品类别为分组,各个分组里价格最高的产品信息。 实现过程如下: declare @t tabl...

这是一道常见的面试题,在实际项目中经常会用到。

需求:求出以产品类别为分组,各个分组里价格最高的产品信息。

实现过程如下:

declare @t table(
productid int,
productname varchar(20),
producttype varchar(20),
price int)

--测试数据

insert @t
select 1,'name1','p1',3 union all
select 2,'name2','p1',5 union all
select 3,'name3','p2',4 union all
select 4,'name4','p2',4

--做法一:找到每个组里,价格最大的值;然后再找出每个组里价格等于这个值的
--缺点:要进行一次join

select t1.*
 from @t t1
 join (select producttype,
  max(price) price
  from @t
  group by producttype) t2 on t1.producttype = t2.producttype
 where t1.price = t2.price
 order by producttype

--做法二:利用over(),将统计信息计算出来,然后直接筛选结果集。
--over() 可以让函数(包括聚合函数)与行一起输出。

;with cte as(
 select *, max(price) over(partition by (producttype)) maxprice
 from @t)
select productid,productname,producttype,price from cte where price = maxprice
 order by producttype

--over() 的语法为:over([patition by ] <order by >)。需要注意的是,over() 前面是一个函数,如果是聚合函数,那么order by 不能一起使用。
--over() 的另一常用情景是与 row_number() 一起用于分页。

现在来介绍一下开窗函数。

窗口函数over()指定一组行,开窗函数计算从窗口函数输出的结果集中各行的值。 

开窗函数不需要使用group by就可以对数据进行分组,还可以同时返回基础行的列和聚合列。  

1.排名开窗函数

row_number、dense_rank、rank、ntile属于排名函数。

排名开窗函数可以单独使用order by 语句,也可以和partition by同时使用。

partition by用于将结果集进行分组,开窗函数应用于每一组。

oder by 指定排名开窗函数的顺序。在排名开窗函数中必须使用order by语句。

例如查询每个雇员的定单,并按时间排序

with orderinfo as

(

 select row_number() over(partition by employeeid order by orderdate) as number,

 orderid,customerid, employeeid,orderdate from orders (nolock)

)

 

select number,orderid,customerid, employeeid ,orderdate

from orderinfo where number between 0 and 10

窗口函数根据partition by语句按雇员id对数据行分组,然后按照order by 语句排序,排名函数row_number()为每一组的数据分从1开始生成一个序号。 

row_number()为每一组的行按顺序生成一个唯一的序号

rank()也为每一组的行生成一个序号,与row_number()不同的是如果按照order by的排序,如果有相同的值会生成相同的序号,并且接下来的序号是不连序的。例如两个相同的行生成序号3,那么接下来会生成序号5。

dense_rank()和rank()类似,不同的是如果有相同的序号,那么接下来的序号不会间断。也就是说如果两个相同的行生成序号3,那么接下来生成的序号还是4。

ntile (integer_expression) 按照指定的数目将数据进行分组,并为每一组生成一个序号。

2.聚合开窗函数

很多聚合函数都可以用作窗口函数的运算,如sum,avg,max,min。

聚合开窗函数只能使用partition by子句或都不带任何语句,order by不能与聚合开窗函数一同使用。

例如,查询雇员的定单总数及定单信息

with orderinfo as

(

select count(orderid) over(partition by employeeid) as totalcount,orderid,customerid, employeeid,orderdate from orders (nolock)

)

select orderid,customerid, employeeid ,orderdate,totalcount

from orderinfo order by employeeid 

如果窗口函数不使用partition by 语句的话,那么就是不对数据进行分组,聚合函数计算所有的行的值。

with orderinfo as

(

 select count(orderid) over() as count,orderid,customerid, employeeid,orderdate from orders (nolock)

)

以上就是本文的全部内容,希望大家可以学会sql server利用开窗函数进行分组统计的方法,谢谢大家的阅读。