Oracle中distinct和group by去重性能的比较
程序员文章站
2022-05-17 23:06:13
...
之前去重都是使用distinct,后来在项目上优化SQL的时候发现我司有个开发人员喜欢使用group by来去重,他的解释是group by性能好,那么实际情况到底是怎样的呢?我在测试环境下进行了模拟,毕竟,实践是检验真理的唯一标准嘛。
首先创建测试表,使用了dba_objects视图中的数据
-- 创建测试用表obj
create table obj as select * from dba_objects;
alter session set statistics_level=all;
-- 执行两次distinct,避免物理读带来的影响
select distinct object_type from obj;
select distinct object_type from obj
-- 查看执行计划
set linesize 200 pagesize 999
select * from table(dbms_xplan.display_cursor(null,null,'advanced -PROJECTION allstats,last'));
-- 执行group by
select object_type from obj group by object_type;
-- 查看执行计划
set linesize 200 pagesize 999
select * from table(dbms_xplan.display_cursor(null,null,'advanced -PROJECTION allstats,last'));
通过上面的测试可以看出,两种方式在性能上的差异微乎其微,一个是HASH UNIQUE,一个是HASH GROUP BY。
这个测试使用的数据量在8w左右,我们把数据量增加后再来看
insert into obj select * from obj;
/
/
/
扩展过后的数据量在138w左右
我们把数据量扩大以后,性能差距依然微乎其微。
结论:
通过上面的测试,得到的结论就是distinct和group by在性能上的差距很小,不需要关注。但是distinct关键字就是用来去重的,而group by是用了做分组统计的,所以建议使用distinct来做去重,使SQL更易理解。
推荐阅读
-
对python中两种列表元素去重函数性能的比较方法
-
Mysql中distinct与group by的去重方面的区别
-
Hive中的去重 :distinct,group by与ROW_Number()窗口函数
-
对python中两种列表元素去重函数性能的比较方法
-
MySQL中distinct与group by之间的性能进行比较_MySQL
-
Oracle中distinct和group by去重性能的比较
-
Hive中的去重 :distinct,group by与ROW_Number()窗口函数
-
MySQL中distinct与group by之间的性能进行比较_MySQL
-
Mysql中distinct与group by的去重方面的区别