欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

PostgreSQL对GROUP BY子句使用常量的特殊限制详解

程序员文章站 2022-06-24 10:27:14
一、问题描述最近,一个统计程序从oracle移植到postgresql(版本9.4)时,接连报告错误:错误信息1: postgresql group by position 0 is not in s...

一、问题描述

最近,一个统计程序从oracle移植到postgresql(版本9.4)时,接连报告错误:

错误信息1: postgresql group by position 0 is not in select list.

错误信息2: non-integer constant in group by.

产生错误的sql类似于:

insert into sum_tab (intfield1, intfield2, strfield1, strfield2, cnt)
select intfield, 0, strfield, 'null', count(*) from detail_tab
where ...
group by intfield, 0, strfield, 'null';

其中,detail_tab表保存原始的详细记录,而sum_tab保存统计后的记录信息。

二、原因分析

经过测试,发现错误是因为postgresql对group by子句使对使用常量有着特殊限制。测试过程过于繁琐,这里不再一一写demo了,直接给出结论:

1 group by子句中不能使用字符串型、浮点数型常量, 否则会报告错误信息2。如:

select intfield, 'aaa', count(*) from tab group by intfield, 'aaa'; 
select intfield, 0.5, count(*) from tab group by intfield, 0.5;

2 group by子句中也不能使用0和负整数,否则会报错误信息1。如:

select intfield, 0, count(*) from tab group by intfield, 0;
select intfield, -1, count(*) from tab group by intfield, -1;

那么,group by子句中可以使用什么类型的常量?经测试,在常用的类型中,正整数、日期型常量均可以。

select intfield, 1, count(*) from tab group by intfield, 1;
select intfield, now(), count(*) from tab group by intfield, now();

对于第一节中的sql,因为0和‘null'有着特殊的含义,该如何处理?

实际上,在group by子句中可以不使用任何常量,只列出聚集字段即可,即将第一节中的sql改为:

insert into sum_tab (intfield1, intfield2, strfield1, strfield2, cnt)
select intfield, 0, strfield, 'null', count(*) from detail_tab
where ...
group by intfield, strfield;

三、mysql的情况

考虑到将来统计程序也可能移植到mysql(版本8.x),随后进行了类似测试,结论为:

1 支持不带任何常量的group by子句;

2 支持带非0整数、浮点数(包括0.0)、字符串、日期型常量的group by子句。

也就是说,在常见类型中,mysql 8的group by子句支持除整数0(非浮点数0.0)以外的所有类型。否则,会报错:

error 1054 (42s22): unknown column '0' in 'group statement'

顺便说一句,oracle对整数0也支持。

四、结论

1、postgresql的group by子句只支持正整数、日期型的常量;

2、mysql支持除非0整数以外的所有常规类型常量,而oracle似乎全部支持;

3、如果有在各各数据库平台可移植的需求,尽量不要在group by子句中使用常量。

补充:postgresql的group by问题

关于postgresql数据库分组查询时,跟mysql还是有区别的。纠结了半天

select
 prjnumber,
 zjhm,
-- to_char ( to_timestamp ( kqsj / 1000 ), 'yyyy-mm-dd hh24:mi:ss' ) kqsj,

 kqflag,
 workername,
 max(kqsj)
 
-- workertype,
-- tpcodename,
-- isactive 
from
 gb_clockingin 
where
 kqsj between 1590940800000 and 1593532799000 
 and prjnumber = '3205842019121101a01000' 

group by 
 zjhm,
 kqflag,
 prjnumber,
 workername

以上为个人经验,希望能给大家一个参考,也希望大家多多支持。如有错误或未考虑完全的地方,望不吝赐教。