数据库查询优化

时间 2019-12-01

标签数据库查询优化栏目 SQL 繁體版

原文原文链接

咱们要作到不但会写SQL，还要作到写出性能优良的SQL语句。

（1）选择最有效率的表名顺序(只在基于规则的优化器中有效)：

Oracle的解析器按照从右到左的顺序处理FROM子句中的表名，FROM子句中写在最后的表(基础表 driving table)将被最早处理，在FROM子句中包含多个表的状况下,你必须选择记录条数最少的表做为基础表。若是有3个以上的表链接查询, 那就须要选择交叉表(intersection table)做为基础表, 交叉表是指那个被其余表所引用的表。

（2）WHERE子句中的链接顺序：

Oracle采用自下而上的顺序解析WHERE子句,根据这个原理,表之间的链接必须写在其余WHERE条件以前, 那些能够过滤掉最大数量记录的条件必须写在WHERE子句的末尾。中.国.站长站

（3）SELECT子句中避免使用‘*’：

Oracle在解析的过程当中, 会将‘*’依次转换成全部的列名, 这个工做是经过查询数据字典完成的, 这意味着将耗费更多的时间。

（4）减小访问数据库的次数：

Oracle在内部执行了许多工做: 解析SQL语句, 估算索引的利用率, 绑定变量 , 读数据块等。

（5）在SQL*Plus , SQL*Forms和Pro*C中从新设置ARRAYSIZE参数, 能够增长每次数据库访问的检索数据量 ,建议值为200。

（6）使用DECODE函数来减小处理时间：

使用DECODE函数能够避免重复扫描相同记录或重复链接相同的表。

（7）整合简单,无关联的数据库访问：

若是你有几个简单的数据库查询语句,你能够把它们整合到一个查询中(即便它们之间没有关系)。

（8）删除重复记录：

最高效的删除重复记录方法 ( 由于使用了ROWID)例子：
DELETE FROM EMP E WHERE E.ROWID > (SELECT MIN(X.ROWID) FROM EMP X WHERE X.EMP_NO = E.EMP_NO);

（9）用TRUNCATE替代DELETE：

当删除表中的记录时,在一般状况下, 回滚段(rollback segments ) 用来存放能够被恢复的信息. 若是你没有COMMIT事务,ORACLE会将数据恢复到删除以前的状态(准确地说是恢复到执行删除命令以前的情况) 而当运用TRUNCATE时, 回滚段再也不存听任何可被恢复的信息。当命令运行后,数据不能被恢复.所以不多的资源被调用,执行时间也会很短。（TRUNCATE只在删除全表适用,TRUNCATE是DDL不是DML）。 Chinaz_com

（10）尽可能多使用COMMIT：

只要有可能，在程序中尽可能多使用COMMIT, 这样程序的性能获得提升,需求也会由于COMMIT所释放的资源而减小，COMMIT所释放的资源:

a. 回滚段上用于恢复数据的信息。

b. 被程序语句得到的锁。

c. redo log buffer 中的空间。 Chinaz@com

d. Oracle为管理上述3种资源中的内部花费。

（11）用Where子句替换HAVING子句：

避免使用HAVING子句，HAVING 只会在检索出全部记录以后才对结果集进行过滤。这个处理须要排序,总计等操做。若是能经过WHERE子句限制记录的数目，那就能减小这方面的开销。(非 oracle中)on、where、having这三个均可以加条件的子句中，on是最早执行，where次之，having最后，由于on是先把不符合条件的记录过滤后才进行统计，它就能够减小中间运算要处理的数据，按理说应该速度是最快的，where也应该比having快点的，由于它过滤数据后才进行sum，在两个表联接时才用on的，因此在一个表的时候，就剩下where跟having比较了。在这单表查询统计的状况下，若是要过滤的条件没有涉及到要计算字段，那它们的结果是同样的，只是where可使用rushmore技术，而having就不能，在速度上后者要慢若是要涉及到计算的字段，就表示在没计算以前，这个字段的值是不肯定的，根据上篇写的工做流程，where的做用时间是在计算以前就完成的，而having就是在计算后才起做用的，因此在这种状况下，二者的结果会不一样。在多表联接查询时，on比where更早起做用。系统首先根据各个表之间的联接条件，把多个表合成一个临时表后，再由where进行过滤，而后再计算，计算完后再由having进行过滤。因而可知，要想过滤条件起到正确的做用，首先要明白这个条件应该在何时起做用，而后再决定放在那里。

（12）减小对表的查询：
在含有子查询的SQL语句中,要特别注意减小对表的查询。例子： Chinaz

SELECT TAB_NAME FROM TABLES WHERE (TAB_NAME,DB_VER) = ( SELECTTAB_NAME,DB_VER FROM TAB_COLUMNS WHERE VERSION = 604)

（13）经过内部函数提升SQL效率：

复杂的SQL每每牺牲了执行效率。可以掌握上面的运用函数解决问题的方法在实际工做中是很是有意义的。

（14）使用表的别名(Alias)：
当在SQL语句中链接多个表时, 请使用表的别名并把别名前缀于每一个Column上。这样一来,就能够减小解析的时间并减小那些由Column歧义引发的语法错误。 Chinaz_com

（15）用EXISTS替代IN、用NOT EXISTS替代NOT IN：

在许多基于基础表的查询中，为了知足一个条件,每每须要对另外一个表进行联接。在这种状况下，使用EXISTS(或NOT EXISTS)一般将提升查询的效率。在子查询中，NOT IN子句将执行一个内部的排序和合并。不管在哪一种状况下，NOT IN都是最低效的 (由于它对子查询中的表执行了一个全表遍历)。为了不使用NOT IN ，咱们能够把它改写成外链接(Outer Joins)或NOT EXISTS。

例子：
（高效）SELECT * FROM EMP (基础表) WHERE EMPNO > 0 AND EXISTS (SELECT ‘X' FROM DEPT WHERE DEPT.DEPTNO = EMP.DEPTNO AND LOC = ‘MELB')(低效)SELECT * FROM EMP (基础表) WHERE EMPNO > 0 AND DEPTNO IN(SELECT DEPTNO FROM DEPT WHERE LOC = ‘MELB')

（16）识别‘低效执行’的SQL语句：

虽然目前各类关于SQL优化的图形化工具层出不穷,可是写出本身的SQL工具来解决问题始终是一个最好的方法：

SELECT EXECUTIONS , DISK_READS, BUFFER_GETS, ROUND((BUFFER_GETS-DISK_READS)/BUFFER_GETS,2) Hit_radio, ROUND(DISK_READS/EXECUTIONS,2) Reads_per_run, SQL_TEXT FROM V$SQLAREA WHERE EXECUTIONS>0 AND BUFFER_GETS > 0 AND (BUFFER_GETS-DISK_READS)/BUFFER_GETS < 0.8 ORDER BY 4 DESC;

索引是表的一个概念部分，用来提升检索数据的效率，Oracle使用了一个复杂的自平衡B-tree结构。一般,经过索引查询数据比全表扫描要快。当 Oracle找出执行查询和Update语句的最佳路径时, Oracle优化器将使用索引。一样在联结多个表时使用索引也能够提升效率。另外一个使用索引的好处是,它提供了主键(primary key)的惟一性验证。那些LONG或LONG RAW数据类型, 你能够索引几乎全部的列。一般, 在大型表中使用索引特别有效. 固然,你也会发现, 在扫描小表时，使用索引一样能提升效率。虽然使用索引能获得查询效率的提升,可是咱们也必须注意到它的代价。索引须要空间来存储,也须要按期维护, 每当有记录在表中增减或索引列被修改时, 索引自己也会被修改。这意味着每条记录的INSERT，DELETE ， UPDATE将为此多付出四、 5次的磁盘I/O 。由于索引须要额外的存储空间和处理，那些没必要要的索引反而会使查询反应时间变慢。按期的重构索引是有必要的：

ALTER INDEX <INDEXNAME> REBUILD <TABLESPACENAME>

（18）用EXISTS替换DISTINCT：

当提交一个包含一对多表信息(好比部门表和雇员表)的查询时，避免在SELECT子句中使用DISTINCT。通常能够考虑用EXIST替换， EXISTS 使查询更为迅速，由于RDBMS核心模块将在子查询的条件一旦知足后，马上返回结果。例子：

(低效): SELECT DISTINCT DEPT_NO,DEPT_NAME FROM DEPT D , EMP E WHERE D.DEPT_NO = E.DEPT_NO (高效): SELECT DEPT_NO,DEPT_NAME FROM DEPT D WHERE EXISTS ( SELECT ‘X' FROM EMP E WHERE E.DEPT_NO = D.DEPT_NO);

（19）SQL语句用大写的；由于Oracle老是先解析SQL语句，把小写的字母转换成大写的再执行。

（20）在Java代码中尽可能少用链接符“＋”链接字符串。

（21）避免在索引列上使用NOT一般，咱们要避免在索引列上使用NOT, NOT会产生在和在索引列上使用函数相同的影响。当Oracle“遇到”NOT,他就会中止使用索引转而执行全表扫描。

（22）避免在索引列上使用计算。WHERE子句中，若是索引列是函数的一部分。优化器将不使用索引而使用全表扫描。

低效： SELECT … FROM DEPT WHERE SAL * 12 > 25000; 高效: SELECT … FROM DEPT WHERE SAL > 25000/12;

（23）用>=替代>：

高效：SELECT * FROM EMP WHERE DEPTNO >=4 低效: SELECT * FROM EMP WHERE DEPTNO >3

二者的区别在于，前者DBMS将直接跳到第一个DEPT等于4的记录然后者将首先定位到DEPTNO=3的记录而且向前扫描到第一个DEPT大于3的记录。

（24）用UNION替换OR (适用于索引列)：

一般状况下，用UNION替换WHERE子句中的OR将会起到较好的效果。对索引列使用OR将形成全表扫描。注意，以上规则只针对多个索引列有效。若是有 column没有被索引，查询效率可能会由于你没有选择OR而下降。在下面的例子中，LOC_ID 和REGION上都建有索引。

高效：SELECT LOC_ID 。 LOC_DESC ，REGION FROM LOCATION WHERE LOC_ID = 10 UNION SELECT LOC_ID ，LOC_DESC ，REGION FROM LOCATION WHERE REGION = “MELBOURNE”

低效: SELECT LOC_ID ，LOC_DESC ，REGION FROM LOCATION WHERE LOC_ID = 10 OR REGION = “MELBOURNE”

（25）用IN来替换OR：

这是一条简单易记的规则，可是实际的执行效果还须检验，在Oracle8i下，二者的执行路径彷佛是相同的:　

低效:

SELECT…. FROM LOCATION WHERE LOC_ID = 10 OR LOC_ID = 20 OR LOC_ID = 30

高效：

SELECT… FROM LOCATION WHERE LOC_IN IN (10,20,30);

（26）避免在索引列上使用IS NULL和IS NOT NULL：

避免在索引中使用任何能够为空的列，Oracle将没法使用该索引。对于单列索引，若是列包含空值，索引中将不存在此记录。对于复合索引，若是每一个列都为空，索引中一样不存在此记录。若是至少有一个列不为空，则记录存在于索引中。举例：若是惟一性索引创建在表的A列和B列上，而且表中存在一条记录的A，B 值为(123，null)， Oracle将不接受下一条具备相同A，B值（123,null）的记录(插入)。然而若是全部的索引列都为空，Oracle将认为整个键值为空而空不等于空。所以你能够插入1000 条具备相同键值的记录,固然它们都是空! 由于空值不存在于索引列中,因此WHERE子句中对索引列进行空值比较将使ORACLE停用该索引。

低效: (索引失效)

SELECT … FROM DEPARTMENT WHERE DEPT_CODE IS NOT NULL;

高效：(索引有效)

SELECT … FROM DEPARTMENT WHERE DEPT_CODE >=0; 站长.站

（27）老是使用索引的第一个列：
若是索引是创建在多个列上，只有在它的第一个列(leading column)被where子句引用时，优化器才会选择使用该索引。这也是一条简单而重要的规则，当仅引用索引的第二个列时，优化器使用了全表扫描而忽略了索引。

（28）用UNION-ALL 替换UNION ( 若是有可能的话)：

当SQL语句须要UNION两个查询结果集合时，这两个结果集合会以UNION-ALL的方式被合并，而后在输出最终结果前进行排序。若是用UNION ALL替代UNION，这样排序就不是必要了。效率就会所以获得提升。须要注意的是，UNION ALL 将重复输出两个结果集合中相同记录。所以各位仍是要从业务需求分析使用UNION ALL的可行性。 UNION 将对结果集合排序,这个操做会使用到SORT_AREA_SIZE这块内存。对于这块内存的优化也是至关重要的。下面的SQL能够用来查询排序的消耗量： Www.Chinaz.com

低效： SELECT ACCT_NUM, BALANCE_AMT FROM DEBIT_TRANSACTIONS WHERE TRAN_DATE = '31-DEC-95' UNION SELECT ACCT_NUM, BALANCE_AMT FROM DEBIT_TRANSACTIONS WHERE TRAN_DATE = '31-DEC-95' 高效: SELECT ACCT_NUM, BALANCE_AMT FROM DEBIT_TRANSACTIONS WHERE TRAN_DATE = '31-DEC-95' UNION ALL SELECT ACCT_NUM, BALANCE_AMT FROM DEBIT_TRANSACTIONS WHERE TRAN_DATE = '31-DEC-95'

（29）用WHERE替代ORDER BY：

ORDER BY 子句只在两种严格的条件下使用索引。

ORDER BY中全部的列必须包含在相同的索引中并保持在索引中的排列顺序。

ORDER BY中全部的列必须定义为非空。

WHERE子句使用的索引和ORDER BY子句中所使用的索引不能并列。

例如: 表DEPT包含如下列:

DEPT_CODE PK NOT NULL

DEPT_DESC NOT NULL

DEPT_TYPE NULL

低效: (索引不被使用)

SELECT DEPT_CODE FROM DEPT ORDER BY DEPT_TYPE

高效: (使用索引)

SELECT DEPT_CODE FROM DEPT WHERE DEPT_TYPE > 0

（30）避免改变索引列的类型:

当比较不一样数据类型的数据时， ORACLE自动对列进行简单的类型转换。假设 EMPNO是一个数值类型的索引列：SELECT … FROM EMP WHERE EMPNO = ‘123'。实际上,通过Oracle类型转换, 语句转化为: SELECT … FROM EMP WHERE EMPNO = TO_NUMBER(‘123') 。

幸运的是,类型转换没有发生在索引列上,索引的用途没有被改变。如今,假设EMP_TYPE是一个字符类型的索引列：SELECT … FROM EMP WHERE EMP_TYPE = 123 。

这个语句被Oracle转换为: SELECT … FROM EMP WHERETO_NUMBER(EMP_TYPE)=123。由于内部发生的类型转换，这个索引将不会被用到! 为了不Oracle对你的SQL进行隐式的类型转换，最好把类型转换用显式表现出来。注意当字符和数值比较时，Oracle会优先转换数值类型到字符类型。

（31）须要小心的WHERE子句:

某些SELECT 语句中的WHERE子句不使用索引。这里有一些例子：

(1)‘!=' 将不使用索引。记住, 索引只能告诉你什么存在于表中, 而不能告诉你什么不存在于表中。

(2)‘||'是字符链接函数。就象其余函数那样, 停用了索引。

(3)‘+'是数学函数。就象其余数学函数那样, 停用了索引。

(4)相同的索引列不能互相比较,这将会启用全表扫描。

（32）a. 若是检索数据量超过30%的表中记录数，使用索引将没有显著的效率提升。

b. 在特定状况下，使用索引也许会比全表扫描慢，但这是同一个数量级上的区别。而一般状况下,使用索引比全表扫描要块几倍乃至几千倍！

（33）避免使用耗费资源的操做：

带有DISTINCT,UNION,MINUS,INTERSECT,ORDER BY的SQL语句会启动SQL引擎执行耗费资源的排序(SORT)功能。DISTINCT须要一次排序操做，而其余的至少须要执行两次排序。一般，带有 UNION, MINUS , INTERSECT的SQL语句均可以用其余方式重写。若是你的数据库的SORT_AREA_SIZE调配得好。使用UNION , MINUS, INTERSECT也是能够考虑的, 毕竟它们的可读性很强。

（34）优化GROUP BY：

提升GROUP BY 语句的效率，能够经过将不须要的记录在GROUP BY 以前过滤掉。下面两个查询返回相同结果但第二个明显就快了许多。

低效: SELECT JOB , AVG(SAL) FROM EMP GROUP JOB HAVING JOB = ‘PRESIDENT' OR JOB = ‘MANAGER' 高效: SELECT JOB , AVG(SAL) FROM EMP WHERE JOB = ‘PRESIDENT' OR JOB = ‘MANAGER' GROUP JOB数据库