对于sql的join,在学习起来可能是比较乱的。我们知道,sql的join语法有很多inner的,有outer的,有left的,有时候,对于select出来的结果集是什么样...
对于sql的join,在学习起来可能是比较乱的。我们知道,sql的join语法有很多inner的,有outer的,有left的,有时候,对于select出来的结果集是什么样子有点不是很清楚。coding horror上有一篇文章(实在不清楚为什么coding horror也被墙)通过 文氏图 venn diagrams 解释了sql的join。我觉得清楚易懂,转过来。
假设我们有两张表。
table a 是左边的表。
table b 是右边的表。
其各有四条记录,其中有两条记录是相同的,如下所示:
id name id name
-- ---- -- ----
1 pirate 1 rutabaga
2 monkey 2 pirate
3 ninja 3 darth vader
4 spaghetti 4 ninja
下面让我们来看看不同的join会产生什么样的结果。
select * from tablea inner join tableb on tablea.name = tableb.name
id name id name -- ---- -- ---- 1 pirate 2 pirate 3 ninja 4 ninjainner join 产生的结果集中,是a和b的交集。
|
|
select * from tablea full outer join tableb on tablea.name = tableb.name
id name id name -- ---- -- ---- 1 pirate 2 pirate 2 monkey null null 3 ninja 4 ninja 4 spaghetti null null null null 1 rutabaga null null 3 darth vaderfull outer join 产生a和b的并集。但是需要注意的是,对于没有匹配的记录,则会以null做为值。
|
|
select * from tablea left outer join tableb on tablea.name = tableb.name
id name id name -- ---- -- ---- 1 pirate 2 pirate 2 monkey null null 3 ninja 4 ninja 4 spaghetti null nullleft outer join 产生表a的完全集,而b表中匹配的则有值,没有匹配的则以null值取代。
|
|
select * from tablea left outer join tableb on tablea.name = tableb.name where tableb.id is null
id name id name -- ---- -- ---- 2 monkey null null 4 spaghetti null null产生在a表中有而在b表中没有的集合。
|
|
select * from tablea full outer join tableb on tablea.name = tableb.name where tablea.id is null or tableb.id is null
id name id name -- ---- -- ---- 2 monkey null null 4 spaghetti null null null null 1 rutabaga null null 3 darth vader产生a表和b表都没有出现的数据集。
|
|
还需要注册的是我们还有一个是“交差集” cross join, 这种join没有办法用文式图表示,因为其就是把表a和表b的数据进行一个n*m的组合,即笛卡尔积。表达式如下:
select * from tablea
cross join tableb
这个笛卡尔乘积会产生 4 x 4 = 16 条记录,一般来说,我们很少用到这个语法。但是我们得小心,如果不是使用嵌套的select语句,一般系统都会产生笛卡尔乘积然再做过滤。这是对于性能来说是非常危险的,尤其是表很大的时候。