欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

postgresql数据合并,多条数据合并成1条的操作

程序员文章站 2022-04-05 16:35:55
对于主表中一条记录,对应明细表中的96条数据,每一条数据相隔15分钟,明细中没96条数据对应主表中的一个日期trade_date,并且每条明细中有一个字段start_time, 即明细中每96条数据中...

对于主表中一条记录,对应明细表中的96条数据,每一条数据相隔15分钟,明细中没96条数据对应主表中的一个日期trade_date,并且每条明细中有一个字段start_time, 即明细中每96条数据中第一条数据中start_time为00:00,

第二条为00:15,第三条为00:30,依次类推,直到23:45 ,现在要将明细表中的96条数据合并成24条,即第一条数据中start_time为00:00,第二条为01:00,第三条为02:00

sql:select max(de.bid_num) report_num,concat(to_char(to_timestamp(concat(ru.trade_date,' ',de.start_time), 'yyyy-mm-dd hh24:mi') :: timestamp without time zone, 'hh24 '),':00') dd from quote_trade_rule ru left join quote_trade_rule_detail de on ru.trade_rule_id = de.trade_rule_id
where
  1 = 1
and ru.market_id ='a29c81ed-2baf-4c42-881a-f1e64a41e1b0'
and to_char(ru.trade_date, 'yyyy-mm-dd') ='2018-10-17'
and ru.rule_type ='2' group by dd ,trade_date order by dd,trade_date

postgresql数据合并,多条数据合并成1条的操作

将10条主表数据对应的960条明细数据合并成如下24条数据:

postgresql数据合并,多条数据合并成1条的操作

补充:postgresql中执行计划的合并连接

merge join

通常情况下,散列连接的效果比合并连接好,但如果源数据上有索引,或者结果已经被排过序,在执行排序合并连接时,就不需要排序了,这时合并连接的性能会优于散列连接。

下面示例中,people的id字段和dept01的depto字段都有索引,且从索引扫描的数据已经排好序,可以直接走merge join:

highgo=# explain select people.id from people,dept01 where people.id=dept01.deptno;
                      query plan
-------------------------------------------------------------------------------------------------
 merge join (cost=0.86..64873.59 rows=1048576 width=4)
  merge cond: (people.id = dept01.deptno)
  -> index only scan using people_pkey on people (cost=0.44..303935.44 rows=10000000 width=4)
  -> index only scan using idx_deptno on dept01 (cost=0.42..51764.54 rows=1048576 width=2)
(4 行记录)

删除dept01上的索引,会发现执行计划中先对dept01排序后在走merge join,示例如下:

highgo=# explain select people.id from people,dept01 where people.id=dept01.deptno;
                      query plan
-------------------------------------------------------------------------------------------------
 merge join (cost=136112.80..154464.29 rows=1048576 width=4)
  merge cond: (people.id = dept01.deptno)
  -> index only scan using people_pkey on people (cost=0.44..303935.44 rows=10000000 width=4)
  -> materialize (cost=136112.36..141355.24 rows=1048576 width=2)
     -> sort (cost=136112.36..138733.80 rows=1048576 width=2)
        sort key: dept01.deptno
        -> seq scan on dept01 (cost=0.00..16918.76 rows=1048576 width=2)
(7 行记录)

上面执行计划中,可看到“sort key: dept01.deptno”,这就是对表dept01的id字段进行排序。

以上为个人经验,希望能给大家一个参考,也希望大家多多支持。如有错误或未考虑完全的地方,望不吝赐教。