欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

Oracle数据库JOB失败后的重试规律解密

程序员文章站 2022-11-25 21:19:43
由于官方文档上没有找到相关的说明,所以这里进行了如下测试,为了找到oracle中 job 失败后重试时间的规律。 数据库版本:11.2.0.3 测试说明:这里创建了一个...
由于官方文档上没有找到相关的说明,所以这里进行了如下测试,为了找到oracle中 job 失败后重试时间的规律。

数据库版本:11.2.0.3

测试说明:这里创建了一个日志表以及一个运行时必定出错的procedure,用于job的运行。这里只要记录下每次job执行时视图user_jobs 中的 next_date就可以推断出job 执行失败后的重试规律。
为了测试job的重试规律我做了如下工作
日志表以及序列:
create table job_exec_logs (id number ,current_date date , next_date date ,failures number ,broken varchar2( 2)) ;

create sequence seq_job_exec_logs_id ;

测试procedure
create or replace procedure pro_my_test is
begin
  insert into job_exec_logs select
seq_job_exec_logs_id.nextval , sysdate , next_date , failures , broken from user_jobs ;
  commit ;
  execute immediate 'select * from ddddsfs' ;
end ;
其中ddddsfs表示不存在的,也就是说只要运行pro_my_test存储过程到最后都会出错(但是日志表还是可以正常插入进去的)
创建job:
var job number ;
begin
  sys.dbms_job.submit(job => :job,
                      what => 'pro_my_test ;',
                      next_date => sysdate,
                      interval => 'sysdate+5' );
  commit;
end;
/

其实整个测试过程没什么可说的,让job自动运行即可,但是需要等待job下次重试时间。
最后测试的结果:
dexter@repo>select trunc((next_date-lag(next_date,1) over (order by 4))*24*60) from (
  2  select * from job_exec_logs
  3  union all
  4  select 11111, sysdate , next_date ,failures , broken from user_jobs
  5  order by 4 nulls first) ;

trunc((next_date-lag(next_date,1)over(order by 4))*24*60)
-------------------------------------------------------

                                                      2
                                                      4
                                                      8
                                                     15
                                                     32
                                                     64
                                                    128
                                                    256
                                                    512
                                                   1024
                                                   1440
                                                   1440

已选择13行。

如上结果以及笔者的其他测试可以判断出: 1、每次重试时间都是递增的,第一次2分钟,4分钟,8分钟,16分钟 ... 依此类推。 2、当超过1440分钟,也就是24小时的时候,固定的重试时间为1天。 3、笔者还经过其他实验得知,超过16次重试后,job 就会被标记为broken ,next_date 为4000-1-1,也就是不再进行job重试。 4、oracle数据库重试的时间到达设定的下次执行时间后,以设定的job执行时间为准。
想要了解更多,可以看下metalink
broken jobs and the job queue (文档id 103349.1)