(转贴)SQL Server多表查询的优化方案

时间 2019-11-07

标签 sql server 查询优化方案栏目 SQL 繁體版

原文原文链接

SQL Server多表查询的优化方案是本文咱们主要要介绍的内容，本文咱们给出了优化方案和具体的优化实例，接下来就让咱们一块儿来了解一下这部份内容。数据库

1.执行路径ide

ORACLE的这个功能大大地提升了SQL的执行性能并节省了内存的使用:咱们发现,单表数据的统计比多表统计的速度彻底是两个概念.单表统计可能只要0.02秒,可是2张表联合统计就工具

可能要几十秒了.这是由于ORACLE只对简单的表提供高速缓冲(cache buffering) ,这个功能并不适用于多表链接查询..数据库管理员必须在init.ora中为这个区域设置合适的参数,当这个内存区域越大,就能够保留更多的语句,固然被共享的可能性也就越大了.性能

2.选择最有效率的表名顺序(记录少的放在后面)优化

ORACLE的解析器按照从右到左的顺序处理FROM子句中的表名,所以FROM子句中写在最后的表(基础表 driving table)将被最早处理. 在FROM子句中包含多个表的状况下,你必须选择记录条数最少的表做为基础表.当ORACLE处理多个表时, 会运用排序及合并的方式链接它们.首先,扫描第一个表(FROM子句中最后的那个表)并对记录进行派序,而后扫描第二个表(FROM子句中最后第二个表),最后将全部从第二个表中检索出的记录与第一个表中合适记录进行合并.url

例如:spa

表 TAB1 16,384 条记录code

表 TAB2 1条记录orm

选择TAB2做为基础表 (最好的方法)排序

select count(*) from tab1,tab2 执行时间0.96秒

选择TAB2做为基础表 (不佳的方法)

select count(*) from tab2,tab1 执行时间26.09秒

若是有3个以上的表链接查询, 那就须要选择交叉表(intersection table)做为基础表, 交叉表是指那个被其余表所引用的表.

例如: EMP表描述了LOCATION表和CATEGORY表的交集.

   
 
   SELECT *   
 
   FROM LOCATION L ,   
 
          CATEGORY C,   
 
          EMP E   
 
   WHERE E.EMP_NO BETWEEN 1000 AND 2000 
 
   AND E.CAT_NO = C.CAT_NO   
 
   AND E.LOCN = L.LOCN

将比下列SQL更有效率

   
 
   SELECT *   
 
   FROM EMP E ,   
 
   LOCATION L , 
 
          CATEGORY C 
 
   WHERE   E.CAT_NO = C.CAT_NO 
 
   AND E.LOCN = L.LOCN 
 
   AND E.EMP_NO BETWEEN 1000 AND 2000

3.WHERE子句中的链接顺序(条件细的放在后面)

ORACLE采用自下而上的顺序解析WHERE子句,根据这个原理,表之间的链接必须写在其余WHERE条件以前, 那些能够过滤掉最大数量记录的条件必须写在WHERE子句的末尾.

例如:

(低效,执行时间156.3秒)

   
 
   SELECT …   
 
   FROM EMP E 
 
   WHERE   SAL > 50000 
 
   AND     JOB = ‘MANAGER’ 
 
   AND     25 < (SELECT COUNT(*) FROM EMP 
 
   WHERE MGR=E.EMPNO); 
 
   (高效,执行时间10.6秒)   
 
   SELECT …   
 
   FROM EMP E 
 
   WHERE 25 < (SELECT COUNT(*) FROM EMP 
 
                 WHERE MGR=E.EMPNO)   
 
   AND     SAL > 50000   
 
   AND     JOB = ‘MANAGER’;

4.SELECT子句中避免使用'* '

当你想在SELECT子句中列出全部的COLUMN时,使用动态SQL列引用 '*' 是一个方便的方法.不幸的是,这是一个很是低效的方法. 实际上,ORACLE在解析的过程当中, 会将'*' 依次转换成全部的列名, 这个工做是经过查询数据字典完成的, 这意味着将耗费更多的时间.

5.减小访问数据库的次数

当执行每条SQL语句时, ORACLE在内部执行了许多工做: 解析SQL语句, 估算索引的利用率, 绑定变量 , 读数据块等等. 因而可知, 减小访问数据库的次数 , 就能实际上减小ORACLE的工做量.

方法1 (低效)

   
 
   SELECT EMP_NAME , SALARY , GRADE   
 
        FROM EMP   
 
        WHERE EMP_NO = 342;   
 
         SELECT EMP_NAME , SALARY , GRADE   
 
        FROM EMP   
 
        WHERE EMP_NO = 291;

方法2 (高效)

   
 
   SELECT A.EMP_NAME , A.SALARY , A.GRADE, 
 
                B.EMP_NAME , B.SALARY , B.GRADE   
 
        FROM EMP A,EMP B   
 
        WHERE A.EMP_NO = 342  
 
        AND    B.EMP_NO = 291;

6.删除重复记录

最高效的删除重复记录方法 ( 由于使用了ROWID)

   
 
   DELETE FROM EMP E   
 
   WHERE E.ROWID > (SELECT MIN(X.ROWID)   
 
                       FROM EMP X   
 
                       WHERE X.EMP_NO = E.EMP_NO);

7.用TRUNCATE替代DELETE

当删除表中的记录时,在一般状况下, 回滚段(rollback segments ) 用来存放能够被恢复的信息. 若是你没有COMMIT事务,ORACLE会将数据恢复到删除以前的状态(准确地说是恢复到执行删除命令以前的情况)，而当运用TRUNCATE时, 回滚段再也不存听任何可被恢复的信息.当命令运行后,数据不能被恢复.所以不多的资源被调用,执行时间也会很短.

8.尽可能多使用COMMIT

只要有可能,在程序中尽可能多使用COMMIT, 这样程序的性能获得提升,需求也会由于COMMIT所释放的资源而减小:

COMMIT所释放的资源:

a. 回滚段上用于恢复数据的信息.

b. 被程序语句得到的锁

c. redo log buffer 中的空间

d. ORACLE为管理上述3种资源中的内部花费(在使用COMMIT时必需要注意到事务的完整性,现实中效率和事务完整性每每是鱼和熊掌不可得兼)

9.减小对表的查询

在含有子查询的SQL语句中,要特别注意减小对表的查询.

例如：

低效：

   
 
   SELECT TAB_NAME   
 
              FROM TABLES   
 
              WHERE TAB_NAME = ( SELECT TAB_NAME   
 
                                    FROM TAB_COLUMNS   
 
                                    WHERE VERSION = 604)   
 
              AND　DB_VER= ( SELECT DB_VER   
 
                               FROM TAB_COLUMNS   
 
                               WHERE VERSION = 604

高效：

   
 
   SELECT TAB_NAME   
 
              FROM TABLES   
 
              WHERE   (TAB_NAME,DB_VER)   
 
   = ( SELECT TAB_NAME,DB_VER)   
 
                       FROM TAB_COLUMNS   
 
                       WHERE VERSION = 604)

Update 多个Column 例子:

低效：

   
 
   UPDATE EMP   
 
               SET EMP_CAT = (SELECT MAX(CATEGORY) FROM EMP_CATEGORIES),  
 
                  SAL_RANGE = (SELECT MAX(SAL_RANGE) FROM EMP_CATEGORIES) 
 
               WHERE EMP_DEPT = 0020;

高效:

   
 
   UPDATE EMP   
 
               SET (EMP_CAT, SAL_RANGE)   
 
   = (SELECT MAX(CATEGORY) , MAX(SAL_RANGE)   
 
   FROM EMP_CATEGORIES)   
 
               WHERE EMP_DEPT = 0020;

10.用EXISTS替代IN,用NOT EXISTS替代NOT IN

在许多基于基础表的查询中,为了知足一个条件,每每须要对另外一个表进行联接.在这种状况下, 使用EXISTS(或NOT EXISTS)一般将提升查询的效率.

低效:

   
 
   SELECT *   
 
   FROM EMP (基础表)   
 
   WHERE EMPNO > 0   
 
   AND DEPTNO IN (SELECT DEPTNO   
 
   FROM DEPT   
 
   WHERE LOC = ‘MELB’)

高效:

   
 
   SELECT *   
 
   FROM EMP (基础表)   
 
   WHERE EMPNO > 0   
 
   AND EXISTS (SELECT ‘X’   
 
   FROM DEPT   
 
   WHERE DEPT.DEPTNO = EMP.DEPTNO  
 
   AND LOC = ‘MELB’)

(相对来讲,用NOT EXISTS替换NOT IN 将更显著地提升效率)

在子查询中,NOT IN子句将执行一个内部的排序和合并. 不管在哪一种状况下,NOT IN都是最低效的 (由于它对子查询中的表执行了一个全表遍历). 为了不使用NOT IN ,咱们能够把它改写成外链接(Outer Joins)或NOT EXISTS.

例如:

   
 
   SELECT …   
 
   FROM EMP   
 
   WHERE DEPT_NO NOT IN (SELECT DEPT_NO   
 
                             FROM DEPT   
 
                             WHERE DEPT_CAT='A');

为了提升效率.改写为:

(方法一: 高效)

   
 
   SELECT ….   
 
   FROM EMP A,DEPT B   
 
   WHERE A.DEPT_NO = B.DEPT(+)   
 
   AND B.DEPT_NO IS NULL   
 
   AND B.DEPT_CAT(+) = 'A'

(方法二: 最高效)

   
 
   SELECT ….   
 
   FROM EMP E   
 
   WHERE NOT EXISTS (SELECT 'X'  
 
                        FROM DEPT D 
 
                        WHERE D.DEPT_NO = E.DEPT_NO   
 
                        AND DEPT_CAT = 'A');

固然,最高效率的方法是有表关联.直接两表关系对联的速度是最快的!

11.识别'低效执行'的SQL语句

用下列SQL工具找出低效SQL:

   
 
   SELECT EXECUTIONS , DISK_READS, BUFFER_GETS,   
 
            ROUND((BUFFER_GETS-DISK_READS)/BUFFER_GETS,2) Hit_radio, 
 
            ROUND(DISK_READS/EXECUTIONS,2) Reads_per_run,   
 
            SQL_TEXT   
 
   FROM    V$SQLAREA   
 
   WHERE   EXECUTIONS>0   
 
   AND      BUFFER_GETS > 0   
 
   AND (BUFFER_GETS-DISK_READS)/BUFFER_GETS < 0.8  
 
   ORDER BY 4 DESC;

(虽然目前各类关于SQL优化的图形化工具层出不穷,可是写出本身的SQL工具来解决问题始终是一个最好的方法)

关于SQL Server多表查询优化方案的相关知识就介绍到这里了，但愿本次的介绍可以对您有所收获！