欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

浅谈sql语句中GROUP BY 和 HAVING的使用方法

程序员文章站 2023-10-24 08:06:20
在介绍group by 和 having 子句前,我们必需先讲讲sql语言中一种特殊的函数:聚合函数, 例如sum, count, max, avg等。这些函数和其...

在介绍group by 和 having 子句前,我们必需先讲讲sql语言中一种特殊的函数:聚合函数,

例如sum, count, max, avg等。这些函数和其它函数的根本区别就是它们一般作用在多条记录上。

select sum(population) from bbc

这里的sum作用在所有返回记录的population字段上,结果就是该查询只返回一个结果,即所有
国家的总人口数。

having是分组(group by)后的筛选条件,分组后的数据组内再筛选
where则是在分组前筛选

通过使用group by 子句,可以让sum 和 count 这些函数对属于一组的数据起作用。

当你指定 group by region 时, 属于同一个region(地区)的一组数据将只能返回一行值.

也就是说,表中所有除region(地区)外的字段,只能通过 sum, count等聚合函数运算后返回一个值.

having子句可以让我们筛选成组后的各组数据.

where子句在聚合前先筛选记录.也就是说作用在group by 子句和having子句前.

而 having子句在聚合后对组记录进行筛选。

让我们还是通过具体的实例来理解group by 和 having 子句,还采用第三节介绍的bbc表。

sql实例:

一、显示每个地区的总人口数和总面积.

select region, sum(population), sum(area)
from bbc
group by region

先以region把返回记录分成多个组,这就是group by的字面含义。分完组后,然后用聚合函数对每组中的不同字段(一或多条记录)作运算。

二、 显示每个地区的总人口数和总面积.仅显示那些面积超过1000000的地区。

select region, sum(population), sum(area)

from bbc8 f4 w2 v( p- f
group by region
having sum(area)>1000000#

在这里,我们不能用where来筛选超过1000000的地区,因为表中不存在这样一条记录。
相反,having子句可以让我们筛选成组后的各组数据

三、查询customer 和order表中用户的订单数

select c.name, count(order_number) as count from orders o,customer c where c.id=o.customer_id group by customer_id;
+--------+-------+
| name | count |
+--------+-------+
| d | 9 |
| cc | 6 |
| 菩提子 | 1 |
| cccccc | 2 |
+--------+-------+

增加having过滤

select c.name, count(order_number) as count from orders o,customer c where c.id=o.customer_id group by customer_id having count(order_number)>5;
+------+-------+
| name | count |
+------+-------+
| d | 9 |
| cc | 6 |
+------+-------+

四、我在多举一些例子

sql> select * from sc;

 sno pno grade
---------- ----- ----------
  1 yw  95
  1 sx  98
  1 yy  90
  2 yw  89
  2 sx  91
  2 yy  92
  3 yw  85
  3 sx  88
  3 yy  96
  4 yw  95
  4 sx  89

 sno pno grade
---------- ----- ----------
  4 yy  88

这个表所描述的是4个学生对应每科学习成绩的记录,其中sno(学生号)、pno(课程名)、grade(成绩)。

1、显示90分以上学生的课程名和成绩

//这是一个简单的查询,并没有使用分组查询

sql> select sno,pno,grade from sc where grade>=90;
 sno pno grade
---------- ----- ----------
  1 yw  95
  1 sx  98
  1 yy  90
  2 sx  91
  2 yy  92
  3 yy  96
  4 yw  95

已选择7行。

2、显示每个学生的成绩在90分以上的各有多少门

//进行分组显示,并且按照where条件之后计数

sql> select sno,count(*) from sc where grade>=90 group by sno;
 sno count(*)
---------- ----------
  1  3
  2  2
  4  1
  3  1

3、这里我们并没有使用having语句,接下来如果我们要评选三好学生,条件是至少有两门课程在90分以上才能有资格,列出有资格的学生号及90分以上的课程数。

//进行分组显示,并且按照where条件之后计数,在根据having子句筛选分组

sql> select sno,count(*) from sc where grade>=90 group by sno having count(*)>=2;
 sno count(*)
---------- ----------
  1  3
  2  2

这个结果是我们想要的,它列出了具有评选三好学生资格的学生号,跟上一个例子比较之后,发现这是在分组后进行的子查询。

4、学校评选先进学生,要求平均成绩大于90分的学生都有资格,并且语文课必须在95分以上,请列出有资格的学生

//实际上,这个查询先把语文大于95分的学生号提取出来,之后求平均值,分组显示后根据having语句选出平均成绩大于90的

sql> select sno,avg(grade) from sc where sno in (select sno from sc where grade>=95 and pno='yw') group by sno having avg(grade)>=90;
 sno avg(grade)
---------- ----------
  1 94.3333333
  4 90.6666667

5、查询比平均成绩至少比学号是3的平均成绩高的学生学号以及平均分数

//having子句中可进行比较和子查询

sql> select sno,avg(grade) from sc
 group by sno
 having avg(grade) > (select avg(grade) from sc where sno=3);

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。