数据库设计及sql语句优化
重点内容在大数据量的环境中,的响应时间是个很大的挑战,这涉及到很多方面:数据层、应用层、业务层、网络规划布局等。
在数据层,我整理了一下几点:
1. 表的合理设计 ;
2. 索引、分区表的合理使用;
3. sql语句的质量;
这篇文章,就从数据库优化开始写起,本文包括及sql语句优化。
一、字段设计
字段是数据库最基本的单位,其设计对性能的影响是很大的。需要注意如下:
a、数据类型尽量用数字型,数字型的比较比字符型的快很多。
b、 数据类型尽量小(在满足可以预见的未来需求的前提下的)。
c、 尽量不要允许null,除非必要,可以用not null+default代替。
d、少用text和image,二进制字段的读写是比较慢的,而且,读取的方法也不多,大部分情况下最好不用。
e、 自增字段要慎用,不利于数据迁移。
二、减少数据库访问次数:
内部机制:当执行每条sql语句时,oracle在内部执行了许多工作:解析sql语句,估算索引的利用率,绑定变量,读数据块等等。
在应用程序中的表现:
能一次查询的sql,尽量不要拆分查询;
避免在循环中执行同一sql;
三、避免使用select *:
oracle在解析的过程中,会将*依次转换成对应表下所有的列名,这是通过内部数据字典完成的,这意味着将耗费更多的时间。
四、用where替换having语句:
尽量避免使用having子句,having只会在检索出所有记录之后才对结果集进行过滤。这个处理需要排序、总计等操作。如果通过where子句限制记录的数目,那就能减少这方面的开销。
例如:select emp_no,avg(slary) from salary group by emp_no having emp_no != ‘5’;
select emp_no,avg(slary) from salary where emp_no != ‘5’ group by emp_no;
五、减少表查询
例如:
select emp_name from emp where emp_no = (
select emp_no from salary where emp_no = ‘3’
) and dept_no =(
select dept_no from salary where emp_no = ‘3’
)
替换成:
select emp_name from emp where (emp_no,dept_no)= (
select emp_no,dept_no from salary where emp_no =’3’
)
六、使用表别名:
当在sql语句中连接多个表时,请使用表的别名并把别名前缀于每个column上。这样一来,就可以减少解析的时间并减少那些由column歧义引起的语法错误。
七、使用exists代替in,not exists 代替not in
八、多表连接查询代替exists
九、使用exists替换distinct
上一篇: Linux基础命令---date