基于Oracle的高性能动态SQL程序开发
摘要:对动态sql的程序开发进行了总结,并结合笔者实际开发经验给出若干开发技巧。
1. 静态sqlsql与动态sql
oracle编译pl/sql程序块分为两个种:其一为前期联编(early binding),即sql语句在程序编译期间就已经确定,大多数的编译情况属于这种类型;另外一种是后期联编(late binding),即sql语句只有在运行阶段才能建立,例如当查询条件为用户输入时,那么oracle的sql引擎就无法在编译期对该程序语句进行确定,只能在用户输入一定的查询条件后才能提交给sql引擎进行处理。通常,静态sql采用前一种编译方式,而动态sql采用后一种编译方式。
本文主要就动态sql的开发进行讨论,并在最后给出一些实际开发的技巧。
2. 动态sql程序开发
理解了动态sql编译的原理,也就掌握了其基本的开发思想。动态sql既然是一种”不确定”的sql,那其执行就有其相应的特点。oracle中提供了execute immediate语句来执行动态sql,语法如下:
excute immediate 动态sql语句 using 绑定参数列表 returning into 输出参数列表;
对这一语句作如下说明:
1) 动态sql是指ddl和不确定的dml(即带参数的dml)
2) 绑定参数列表为输入参数列表,即其类型为in类型,在运行时刻与动态sql语句中的参数(实际上占位符,可以理解为函数里面的形式参数)进行绑定。
3) 输出参数列表为动态sql语句执行后返回的参数列表。
4) 由于动态sql是在运行时刻进行确定的,所以相对于静态而言,其更多的会损失一些系统性能来换取其灵活性。
为了更好的说明其开发的过程,下面列举一个实例:
设数据库的emp表,其数据为如下:
要求:
1.创建该表并输入相应的数据。
2.根据特定id可以查询到其姓名和薪水的信息。
3.根据大于特定的薪水的查询相应的员工信息。
根据前面的要求,可以分别创建三个过程(均使用动态sql)来实现:
过程一:
过程二:
过程三:
注意:在过程二中的动态sql语句使用了占位符“:1“,其实它相当于函数的形式参数,使用”:“作为前缀,然后使用using语句将p_id在运行时刻将:1给替换掉,这里p_id相当于函数里的实参。另外过程三中打开的游标为动态游标,它也属于动态sql的范畴,其整个编译和开发的过程与execute immediate执行的过程很类似,这里就不在赘述了。
3. 动态sql语句开发技巧
前面分析到了,动态sql的执行是以损失系统性能来换取其灵活性的,所以对它进行一定程度的优化也是必要的,笔者根据实际开发经验给出一些开发的技巧,需要指出的是,这里很多经验不仅局限于动态sql,有些也适用于静态sql,在描述中会给予标注。
技巧一:尽量使用类似的sql语句,这样oracle本身通过sga中的共享池来直接对该sql语句进行缓存,那么在下一次执行类似语句时就直接调用缓存中已解析过的语句,以此来提高执行效率。
技巧二:当涉及到集合单元的时候,尽量使用批联编。比如需要对id为100和101的员工的薪水加薪10%,一般情况下应该为如下形式:
对于上面的处理,当数据量大的时候就会显得比较慢,那么如果采用批联编的话,则整个集合首先一次性的传入到sql引擎中进行处理,这样比单独处理效率要高的多,进行批联编处理的代码如下:
这里是使用forall来进行批联编,这里将批联编处理的情形作一个小结:
1) 如果一个循环内执行了insert,delete,update等语句引用了集合元素,那么可以将其移动到一个forall语句中。
2) 如果select into,fetch into 或returning into 子句引用了一个集合,应该使用bulk collect 子句进行合并。
3) 如有可能,应该使用主机数组来实现在程序和数据库服务器之间传递参数。
技巧三:使用nocopy编译器来提高pl/sql性能。缺省情况下,out类型和in out类型的参数是由值传递的方式进行的。但是对于大的对象类型或者集合类型的参数传递而言,其希望损耗将是很大的,为了减少损耗,可以采用引用传递的方式,即在进行参数声明的时候引用nocopy关键字来说明即可到达这样的效果。比如创建一个过程:
其中square为一个大的对象类型。这样只是传递一个地址,而不是传递整个对象了。显然这样的处理也是提高了效率。
4. 小结
本文对动态sql的编译原理、开发过程以及开发技巧的讨论,通过本文的介绍后,相信读者对动态sql程序开发有了一个总体的认识,为今后深入的工作打下一个良好的基础。
前面代码部分已经在下列环境中调试成功:
服务器端:unix+oracle9.2
客户端:windows2000 pro+toad