欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

SQL统计函数及分组操作

程序员文章站 2024-03-25 21:10:16
...

本文链接:https://blog.csdn.net/dingchenxixi/article/details/70193634

1.多表查询的操作、限制、笛卡尔积的问题 
2.统计函数及分组统计的操作 
3.子查询的操作,并且结合限定查询、数据排序、多表查询、统计查询一起完成各个复杂查询的操作 
4.数据库的更新操作:增加、修改、删除数据 
5.数据伪列的作用:ROWNUM,ROWID; 
6.完成一套复杂查询的应用案例

统计函数及分组统计的操作
统计函数

统计函数主要有: 
COUNT():用于统计数据数量 
SUM():用于统计数据和 
AVG():统计平均值 
MIN():得到最小值 
MAX():得到最大值 
测试COUNT(),SUM(),AVG()函数,求出所有员工的总工资,平均工资:

  • 1 select count(empno),sum(sal),avg(sal) from emp;

SQL统计函数及分组操作

 

测试MIN(),MAX(),求出员工中最大工资和最小工资:

 

select min(sal),max(sal) from emp;
  • SQL统计函数及分组操作

注意关于COUNT()函数,当数据表中没有数据时,COUNT()总是会返回一个数值,只是这个数值是“0” 
关注BONUS数据表:

SQL统计函数及分组操作

分组统计

当数组重复的时候分组才有意义,因为一个人也可以分为一组,只是没有意义而已,分组采用GROUP BY语句完成,语法如下:
1 SELECT [DISTINCT] * | 列名称 [AS]别名,……..
2 FROM 表名称1 [别名1]
3 [WHERE 条件(s)]
4 [GROUP BY 分组字段1[,分组字段2,...]]
5 [ORDER BY 排序的字段 1,ASC| DESC,排序的字段2 ASC| DESC,….]
例子: 
按照部门编号分组,求出每个部门的人数,平均工资

select count(empno),avg(sal) from emp;

SQL统计函数及分组操作

按照职位分组,求出每个职位的最高和最低工资:

 

select job,max(sal),min(sal) from emp group by job;

SQL统计函数及分组操作

一旦分组之后,实际上对于语法上就会出现新的限制: 
分组函数可在没有分组的时候单独使用,却不能出现其他的查询字段: 

SQL统计函数及分组操作

ename就是其它查询字段。在select子句之后,只能出现分组的字段和统计函数,其它的字段不能出现

分组函数允许嵌套,但是嵌套之后的分组函数的查询之中不能再出现任何其它字段 
例子:按照职位分组,统计平均工资最高的工资

select max(avg(sal)) from emp group by job;
SQL统计函数及分组操作


当添加其它字段‘job’之后出现错误
例子:查询出每个部门的名称、位置、部门的人数、平均工资 
确定所需的数据表: 
emp表:部门的人数,平均工资 
dept表:部门的名称,位置 
确定已知的关联字段: 
emp.deptno = dept.deptno 

SQL统计函数及分组操作


发现dname存在重复,可以进行分组去除重复,按照之前对分组的理解,只要数据重复那么就有可能进行分组的查询操作,但是此时与之前的分组操作 不太一样,之前的分组是针对一张实体表进行分组的(emp,dept都属于实体表),但是对于以上的数据是通过查询结果显示的,所以是一张临时的虚拟表,但是不管是否是实体表还是虚拟表,只要是有重复,那么就直接进行分组
select d.dname,d.loc,count(e.empno),avg(e.sal) from emp e ,dept d where e.deptno=d.deptno group by d.dname,d.loc;
SQL统计函数及分组操作

但是上面这个并不完美,因为dept表中一共有4个部门,那么改善一下,加个连接,同时考虑到部门没有人的话,那么工资肯定是NULL的,所以需要使用到NVL()函数:

select d.dname,d.loc,count(e.empno),nvl(avg(e.sal),0) from emp e ,dept d where e.deptno(+)=d.deptno group by d.dname,d.loc;
SQL统计函数及分组操作

或许刚开始你会写成这样: 

SQL统计函数及分组操作
记住一定是分组字段和统计函数 
例子:要求统计出每个部门的详细信息,并且要求这些部门的平均工资高于2000 
在以上程序的基础之上,就目前而言,需要加上限定语句where子句,所以考虑用where完成:
1 select d.deptno,d.dname,d.loc,nvl(avg(e.sal),0) from dept d, emp e 
2 where d.deptno=e.deptno(+) and nvl(avg(e.sal),0)>2000
3 group by d.deptno,d.dname,d.loc;

SQL统计函数及分组操作

本错误提示的核心意思在于where子句中不能使用统计函数,之所以在where子句中不能使用,实际上跟where子句的主要功能有关,where的主要功能是从全部的数据之中取出部门数据,而这种分组完后需要筛选的就需要用到‘HAVING’子句:
1 select d.deptno,d.dname,d.loc,nvl(avg(e.sal),0) from dept d, emp e 
2 where d.deptno=e.deptno(+) 
3 group by d.deptno,d.dname,d.loc 
4 having nvl(avg(e.sal),0)>2000;

SQL统计函数及分组操作


 

WHERE和HAVING的别 
WHERE:是在执行GROUP BY操作之前进行的过滤,表示从全部数据中筛选出部门数据,WHERE之中不能使用统计函数 
HAVING:是在GROUP BY分组之后的再次过滤,可在HAVING子句中使用统计函数

一道综合题: 
显示非销售人员工作名称以及从事同一工作雇员的月工资总和,并且要满足从事同一工作的雇员的月工资合计大于5000,输出结果按月工资的合计升序排列 
第一步:考虑非销售人员的情况

1 select * from emp where job<>'SALESMAN';
第二步:统计从事同一工作雇员的月工资总和

1 select job ,sum(sal) sum from emp where job<>'SALESMAN' group by job;
第三步:满足从事同一工作的雇员的月工资合计大于5000:

1 select job ,sum(sal) sum from emp where job<>'SALESMAN' group by job having sum(sal)>5000
第四步:输出结果按月工资的合计升序排列:

1 select job ,sum(sal) sum from emp where job<>'SALESMAN' group by job having sum(sal)>5000 order by  sum asc;

SQL统计函数及分组操作