欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  后端开发

select的执行顺序问题

程序员文章站 2024-01-28 12:28:58
...
一张商品表tp_goods:
mysql> select * from tp_goods;
+----+-----------------------+-------------+--------------+--------+
| id | goods_name | goods_price | market_price | cat_id |
+----+-----------------------+-------------+--------------+--------+
| 1 | 锤子手机t1白色版32G | 1998.00 | 2488.00 | 1 |
| 2 | 联想E431笔记本 | 4029.00 | 4998.50 | 2 |
| 3 | mysql数据库深入浅出 | 29.80 | 36.30 | 4 |
| 4 | 苹果6 plus新加坡版 | 2998.00 | 6299.00 | 1 |
| 5 | OSA女装羽绒服2014新款 | 538.50 | 1510.00 | 3 |
+----+-----------------------+-------------+--------------+--------+

根据网上资料
mysql> select cat_id,goods_name,goods_price from tp_goods where cat_id=1;
先执行from操作,得到虚拟表VT1 ??> 然后执行where操作,筛选出cat_id=1的所有行,得到虚拟表VT2。此时的列,还是tp_goods表中所有的列 ??>最后执行 select 操作,此时列是 cat_id, goods_name, goods_price的列,结果返回。
-----------------------------------------------------------------------
mysql> select cat_id,max(goods_price) as max_price from tp_goods group by cat_id;
问题:
1. 这条语句又是如何执行的,group by 和 max函数是同时执行的吗?
2. group by 和 select 又是谁先执行?


回复讨论(解决方案)

1.group by ?先
2.group by ?先

where > group by > 聚合函? > select

1.group by ?先
2.group by ?先

where > group by > 聚合函? > select


那group by执行完成后,产生的虚拟表是什么
行是哪些,列是哪些?

你理解的执行顺序是错误的,至少是不科学的
如果 tp_goods 有 10000000 条记录,而符合 cat_id=1 的只有一条
那么你的第一步的抄写 tp_goods 到 VT1 不就浪费了大量时间和空间了吗?

所以应该是:
建立虚拟表 VT(只有 cat_id,goods_name,goods_price 3列)
遍历 tp_goods 将符合 cat_id=1 的记录追加到 VT 中
输出 VT 的内容

对于 select cat_id,max(goods_price) as max_price from tp_goods group by cat_id
执行的过程应该是:
建立虚拟表 VT(只有 cat_id, max_price 2列,并标识 cat_id 为聚类, max_price 为计算)
遍历 tp_goods 将记录追加到 VT 中,方法是如果 tp_goods.cat_id 的值在 VT.cat_id 中已存在。则修改对应的 max_price 为 max(goods_price,max_price),否则追加
输出 VT 的内容

你理解的执行顺序是错误的,至少是不科学的
如果 tp_goods 有 10000000 条记录,而符合 cat_id=1 的只有一条
那么你的第一步的抄写 tp_goods 到 VT1 不就浪费了大量时间和空间了吗?

所以应该是:
建立虚拟表 VT(只有 cat_id,goods_name,goods_price 3列)
遍历 tp_goods 将符合 cat_id=1 的记录追加到 VT 中
输出 VT 的内容

对于 select cat_id,max(goods_price) as max_price from tp_goods group by cat_id
执行的过程应该是:
建立虚拟表 VT(只有 cat_id, max_price 2列,并标识 cat_id 为聚类, max_price 为计算)
遍历 tp_goods 将记录追加到 VT 中,方法是如果 tp_goods.cat_id 的值在 VT.cat_id 中已存在。则修改对应的 max_price 为 max(goods_price,max_price),否则追加
输出 VT 的内容


版主,有没有书籍推荐,涉及执行过程解释的

书是肯定有的,估计应是1990年代的。不过我没看过(给我看我也不一定去看)

按流程推演,用 php 的关联数组都可以简单的模拟出那个过程
mysql 的开发者们总不至于弱智到用你听说的那个流程来操作的吧

书是肯定有的,估计应是1990年代的。不过我没看过(给我看我也不一定去看)

按流程推演,用 php 的关联数组都可以简单的模拟出那个过程
mysql 的开发者们总不至于弱智到用你听说的那个流程来操作的吧


怎么模拟的?
所以,我想知道mysql开发者们在程序里是如何操作的

按版主的说法,是不是只产生一张虚拟表?如果语句中存在多个 select 呢,会不会有多个虚拟表?如:
select * from tp_goods where cat_id=(select id from tp_cat where cat_name='手机');
版主是否举一个比较复杂的语句,包含where, group by, having, orderby....等等的,来解释一下它第一步的执行过程?

1.from子句用来组装不同数据源的数据2,where子句用于基于指定条件的筛选3.group by 子句用来将数据划分为多个分组4,使用聚集函数进行计算5.使用having子句对分组进行筛选6.计算所有表达式7.使用order by 对所有结果集进行排序
遇到上面括号的情况,当然是按照括号内部再如上述优先级执行。

跑个题:你那表里的 苹果6 是真的么?

特意去翻查了《高性能MySQL》(第二版),没找到楼主说讲的查询顺序的相关描述。希望以下截图能给楼主一些帮助。