开窗函数有浅入深详解(一)
在开窗函数出现之前存在着很多用 sql 语句很难解决的问题,很多都要通过复杂的相关子查询或者存储过程来完成。为了解决这些问题,在2003年iso sql标准加入了开窗函数,开窗函数的使用使得这些经典的难题可以被轻松的解决。
目前在 mssqlserver、oracle、db2 等主流数据库中都提供了对开窗函数的支持,不过非常遗憾的是 mysql 暂时还未对开窗函数给予支持。
为了更加清楚地理解,我们来建表并进行相关的查询(截图为mssqlserver中的结果)
mysql,mssqlserver,db2:
create table t_person ( fname varchar(20), fcity varchar(20), fage int, fsalary int )
oracle:
create table t_person (fname varchar2(20),fcity varchar2(20), fage int,fsalary int)
注:以下结果只在mssqlserver中演示:
t_person 表保存了人员信息,fname 字段为人员姓名,fcity 字段为人员所在的城市名,
fage 字段为人员年龄,fsalary 字段为人员工资。
然后执行下面的sql语句向 t_person表中插入一些演示数据:
insert into t_person(fname,fcity,fage,fsalary) values('tom','beijing',20,3000); insert into t_person(fname,fcity,fage,fsalary) values('tim','chengdu',21,4000); insert into t_person(fname,fcity,fage,fsalary) values('jim','beijing',22,3500); insert into t_person(fname,fcity,fage,fsalary) values('lily','london',21,2000); insert into t_person(fname,fcity,fage,fsalary) values('john','newyork',22,1000); insert into t_person(fname,fcity,fage,fsalary) values('yaoming','beijing',20,3000); insert into t_person(fname,fcity,fage,fsalary) values('swing','london',22,2000); insert into t_person(fname,fcity,fage,fsalary) values('guo','newyork',20,2800); insert into t_person(fname,fcity,fage,fsalary) values('yuqian','beijing',24,8000); insert into t_person(fname,fcity,fage,fsalary) values('ketty','london',25,8500); insert into t_person(fname,fcity,fage,fsalary) values('kitty','chengdu',25,3000); insert into t_person(fname,fcity,fage,fsalary) values('merry','beijing',23,3500); insert into t_person(fname,fcity,fage,fsalary) values('smith','chengdu',30,3000); insert into t_person(fname,fcity,fage,fsalary) values('bill','beijing',25,2000); insert into t_person(fname,fcity,fage,fsalary) values('jerry','newyork',24,3300);
查看表中的内容:
select * from t_person
开窗函数简介
与 聚 合函数一样,开窗函数也是对行集组进行聚合计算,但是它不像普通聚合函数那样每组只返回一个值,开窗函数可以为每组返回多个值,因为开窗函数所执行聚合计算的行集组是窗口。
在iso sql规定了这样的函数为开窗函数,在 oracle中则被称为分析函数,而在db2中则被称为olap函数。
要计算所有人员的总数,我们可以执行下面的 sql语句:
select count(*) from t_person
除了这种较简单的使用方式,有时需要从不在聚合函数中的行中访问这些聚合计算的值。比如我们想查询每个工资小于 5000元的员工信息(城市以及年龄) ,并且在每行中都显示所有工资小于5000元的员工个数,尝试编写下面的 sql语句:
select fcity , fage , count(*) from t_person here fsalary<5000
执行上面的sql以后我们会得到下面的错误信息:
选择列表中的列 't_person.fcity' 无效,因为该列没有包含在聚合函数或 group by 子句中。
这是因为所有不包含在聚合函数中的列必须声明在group by 子句中,
可以进行如下修改:
select fcity, fage, count(*) from t_person where fsalary<5000 group by fcity , fage
执行完毕我们就能在输出结果中看到下面的执行结果:
这个执行结果与我们想像的是完全不同的,这是因为group by子句对结果集进行了分组,所以聚合函数进行计算的对象不再是所有的结果集,而是每一个分组。
可以通过子查询来解决这个问题,sql如下:
select fcity , fage , ( select count(* ) from t_person where fsalary<5000 ) from t_person where fsalary<5000
执行完毕我们就能在输出结果中看到下面的执行结果:
虽然使用子查询能够解决这个问题,但是子查询的使用非常麻烦,使用开窗函数则可以大大简化实现,下面的sql语句展示了如果使用开窗函数来实现同样的效果:
select fcity , fage , count(*) over() from t_person where fsalary<5000
执行完毕我们就能在输出结果中看到下面的执行结果:
可以看到与聚合函数不同的是,开窗函数在聚合函数后增加了一个over 关键字。
开窗函数的调用格式为:
函数名(列) over(选项)
over 关键字表示把函数当成开窗函数而不是聚合函数。sql 标准允许将所有聚合函数用做开窗函数,使用over 关键字来区分这两种用法。
在上边的例子中,开窗函数count(*) over()对于查询结果的每一行都返回所有符合条件的行的条数。over关键字后的括号中还经常添加选项用以改变进行聚合运算的窗口范围。
如果over关键字后的括号中的选项为空,则开窗函数会对结果集中的所有行进行聚合运算。
总结:上述讲述的是开窗函数的基本用法,希望对大家有所帮助!
上一篇: 总结SQL执行进展优化方法
推荐阅读