开发者应了解的一些SQL优化准则

程序员文章站 2022-05-06 15:10:12

...

下面介绍一些开发者在数据库操作中要注意的SQL编码准则。虽然本文不能覆盖所有的准则，但还是希望能给开发者带来些许帮助。下面就来看看在编码实践中哪些应该做，哪些不应该做。

1. 在长时间运行的查询和短查询中使用事务

如果预期有一个长时间运行的查询，并且有大量的数据输出时，开发者就应该在BEGIN TRAN 和END TRAN之间使用事务。

这样事务会在缓冲区缓存为独立事务，并会被分配特定内存，以此来提高处理速度。

2. 不要使用SELECT *

如果使用SELECT * 来选择表中的所有记录，那么一些不必要的记录也被读取、缓存，增加了磁盘的I/O和内存消耗。

3. 避免在WHERE子句中使用显式或隐式函数，比如Convert ()

4. 避免在触发器中执行长时间的操作

5. 适当使用临时表和表变量

当结果集较小的时候，请尽量使用表变量；当结果集相当大时，使用临时表。

6. 使用连接（JOIN）代替子查询（Sub-Queries）

子查询通常作为内联代码来使用，而连接（JOIN）则作为表来使用，这样速度会更快。所以，应尽量避免在连接中使用子查询。

7. 连接条件中表的顺序

在连接条件中，应尽量首先使用较小的表，然后逐步使用较大的表。

8. 循环优化

如果操作在循环内部没有任何影响，那么应尽量将操作放到循环外面，这样可以减少不必要的重复工作。因为，SQL Server优化器不会自动识别这种低效率的代码，更不会自动优化（其他一些语言的编译器可以）。

9. 参数探测

不要在正执行的SP（存储过程）中使用SP参数，这样会导致参数探测（Parameter Sniffing）。应该在声明和设置后再使用SP参数。由于这个原因，SP的行为在每次运行期间都不相同。

10. 当使用条件语句时，可以使用Index（索引）Hint（提示）

比如在SQL Server 2008中，可以使用Index hint，也可以使用fixed plan hint强制在查询中使用hint，以提高运行速度。

11. 在声明中明确指定存储过程中数据类型的大小

开发者随机声明数据类型的大小是不可取的，如：Varchar (500)。这在执行时会在缓冲区中增加不必要的预留空间。

12. 在查询中有效利用MAXDOP（最大并行度）设置

询问数据库管理员关于四核CPU可用性的设置，包括内存的设置，然后适当使用hint，可以有效改善查询速度。

13. SQL Server 2008中的GROUPING SETS

如果数据库服务器为SQL Server 2008，那么可以在所有的Unions中使用Grouping Set来代替Group By。这样在Union中重新进行group by排序时，优化器不会每次都制定一个计划。

14. 当发生死锁时，总是使用With (nolock) 和With (rowlock)

15. 使用Update From，而不是简单的Update

UPDATE titleauthor
SET royaltyper = 90
WHERE au_id = (SELECT au_id FROM authors
WHERE au_lname = ‘Ringer’ AND au_fname = ‘Albert’)
AND title_id = (SELECT title_id FROM titles
WHERE title = ‘Life without Fear’)
Update from
UPDATE titleauthor
SET royaltyper = 90
FROM authors a, titles t
WHERE titleauthor.au_id = a.au_id
AND a.au_lname = ‘Ringer’
AND a.au_fname = ‘Albert’
AND titleauthor.title_id = t.title_id
AND t.title = ‘Life Without Fear’

16. 使用UNION ALL代替UNION

UNION和UNION ALL的差别就在于UNION会对数据做一个distanct的动作，而这个distanct动作的速度则取决于现有数据的数量，数量越大时间越长。因此尽量使用UNION ALL来代替UNION。

17. 避免高成本操作，如NOT LIKE

英文原文：Coding Guidelines for the Developer During Development