一.编写初衷描述 |
【博客地址】http://www.cnblogs.com/grl214 sql
在应有系统开发初期,因为数据库数据较少,对于sql语句各类写法的编写体现不出sql的性能优劣,随着数据的不断增长,出现海量数据,劣质sql与优质sql在执行效率甚至存在百倍差距,可见sql优化的重要性数据库
二.Sql语句性能优化 |
执行计划是一条查询语句在Oracle中执行过程或者访问路径的描述.缓存
1.执行计划经常使用的列字段解释性能优化
基数:返回的结果集行数oracle
字节:执行该步骤后返回的字节数函数
耗费(cust),CPU耗费:Oracle估计的该步骤的执行成本,用于说明SQL执行的代价,理论上越小越好.性能
根据缩进来判断,缩进最多的最早执行(缩进相同时,最上面的最早执行)大数据
Oracle会读取表中的全部行,并检查是否知足where语句中条件;优化
使用建议:数据量太大的表不建议全表扫描ui
ROWID的解释:oracle会自动加在表的每一行的最后一列伪列,表中并不会物理存储ROWID的值,一旦一行数据插入后,则其对应的ROWID在该行的生命周期内是惟一的,即便发生行迁移,该行的ROWID值也不变。
在索引块中即存储每一个索引的键值,也存储具备该键值所对的ROWID.
索引的扫描分两步:首先是找到索引所对的ROWID,其次经过ROWID读取改行数据
索引扫描又分五种:
(a).INDEX UNIQUE SCAN(索引惟一扫描):
针对惟一性索引(UNIQUE INDEX)的扫描,每次至多只返回一条记录,主要针对该字段为主键或者惟一;
(b). INDEX RANGE SCAN(索引范围扫描)
使用一个索引存取多行数据;
发生索引范围扫描的三种状况:
(c). INDEX FULL SCAN(索引全扫描)
(d). INDEX FAST FULL SCAN(索引快速扫描)
(e). INDEX SKIP SCAN(索引跳跃扫描):
Oracle 9i后提供,有时候复合索引的前导列(索引包含的第一列)没有在查询语句中出现,oralce也会使用该复合索引,这时候就使用的INDEX SKIP SCAN;
当Oracle发现前导列的惟一值个数不多时,会将每一个惟一值都做为常规扫描的入口,在此基础上作一次查找,最后合并这些查询;
例如:
假设表emp有ename(雇员名称)、job(职位名)、sex(性别)三个字段,而且创建了如 create index idx_emp on emp (sex, ename, job) 的复合索引;
由于性别只有 '男' 和 '女' 两个值,因此为了提升索引的利用率,Oracle可将这个复合索引拆成 ('男', ename, job),('女', ename, job) 这两个复合索引;
当查询 select * from emp where job = 'Programmer' 时,该查询发出后:
Oracle先进入sex为'男'的入口,这时候使用到了 ('男', ename, job) 这条复合索引,查找 job = 'Programmer' 的条目;
再进入sex为'女'的入口,这时候使用到了 ('女', ename, job) 这条复合索引,查找 job = 'Programmer' 的条目;
最后合并查询到的来自两个入口的结果集。
1.在共享池中查找SQL语句
2.检查语法
3.检查语义和相关的权限
4.合并(MERGE)视图定义和子查询
5.肯定执行计划
绑定(BIND):
1.在语句中查找绑定变量
2.赋值(或从新赋值
执行(EXECUTE):
1.应用执行计划
2.执行必要的I/O和排序操做
提取(FETCH):
1.从查询结果中返回记录
2.必要时进行排序
3.使用ARRAY FETCH机制
共享游标:好处
1.减小解析
2.动态内存调整
3.提升内存使用率
Oracle将执行过程当中的sql语句放在内存的共享池中,能够被全部的数据库用户共享到,当执行一条sql语句时,若是它和以前的sql执行语句彻底相同时,oracle会快速获取被解析的语句以及最好的执行路劲。
这块系统属于全局的区域,可是oracle只对简单的表提供高速缓存,若是是多表的链接查询,数据库管理员必须在启动参数文件中为该区域设置合适的参数,增长共享的可能性。
1.执行语句必须与共享池语句彻底同样,包括(大小写,空格,换行等).
2.两条语句所指的对象必须彻底相同。
3.两个SQL语句绑定变量的名字必须相同。
例子:字符级的比较
SELECT * FROM UR_USER_INFO
Select * from ur_user_info
例子:相同的绑定变量名
select pay_fee,pay_method from bal_payment_info where pay_sn= : pay_sn;
select pay_fee,pay_method from bal_payment_info where pay_sn= : pay_no;
绑定变量不同,不能共享。
当一个Oracle实例接收一条sql后
一、Create a Cursor 建立游标
二、Parse the Statement 分析语句
三、Describe Results of a Query 描述查询的结果集
四、Define Output of a Query 定义查询的输出数据
五、Bind Any Variables 绑定变量
六、Parallelize the Statement 并行执行语句
七、Run the Statement 运行语句
八、Fetch Rows of a Query 取查询出来的行
九、Close the Cursor 关闭游标
例如:
select *from ur_user_info where contract_no = 32013484095139
下面这个语句每执行一次就须要在SHARE POOL 硬解析一
次,一百万用户就是一百万次,消耗CPU和内存,若是业务
量大,极可能致使宕库……
若是绑定变量,则只须要硬解析一次,重复调用便可
例如:
select *from ur_user_info where contract_no = 32013484095139
select *from ur_user_info where contract_no = 12013481213149
使用绑定变量
select *from ur_user_info where contract_no =:contract_no
a、不要使用数据库级的变量绑定参数cursor_sharing来强
制绑定,不管其值为 force 仍是similar
b、有些带> < 的语句绑定变量后可能致使优化器没法正确
使用索引
(1).SQL优化的通常性原则设计方面:
(1).尽可能依赖oracle的优化器,并为其提供条件;
(2).合适的索引,索引的双重效应,列的选择性;
(1).利用索引,避免大表FULL TABLE SCAN;
(2).合理使用临时表;
(3).避免写过于复杂的sql,不必定非要一个sql解决问题;
(4).在不影响业务的前提下减少事务的粒度;
任何sql语句只要在where语句后面添加is null或者is not null,那么oracl优化器将再也不使用索引。
列举两个例子说明该问题:
查询ur_user_info表中phone_no带10的服务号码
例子1:Select *from ur_user_info where phone_no like ‘%10%’;
例子2:Select *from ur_user_info where phone_no like ‘10%’;
因为例1中通配符(%)在搜寻词首出现,因此oracle系统不使用phone_no的索引,通配符会下降查询的效率,但当通配符再也不首出现,又能使用索引,如例2所示。
三.ORACLE语句优化规则 |
例如:TAB1 1000条记录, TAB2 1条记录
选择记录最少的做为基表
Select count(*) from tab1,tab2;
若是有3个或者3个以上的表则选择交叉表做为基表
oracle的解析按照从上而下解析,所以表之间的链接必须写在where条件以前:
例如:
低效率:
select .. from
emp e
where sal > 50000 and job = 'manager'
and 25 < (select count(*) from emp where mgr=e.empno);
高效率:
select .. from
emp e
where 25 < (select count(*) from emp where mgr=e.empno)
and sal > 50000
and job = 'manager';
Sql在执行带通配符的语句时,若是‘%’在首位,那么在字段上创建的主键或者索引将会失效!
应该避免相似语句的出现
Select name from user_info where name=’%A’;
当删除表时,使用delete执行操做,回滚端用来存放可恢复的信息,当没有提交事务的时候,执行回滚事务,数据会恢复到执行delete操做以前,而当用truncate是,回滚端则不会存放可恢复的信息,减小资源的调用。
避免使用 HAVING 子句, HAVING 只会在检索出全部记录以后才对结果集进行过滤. 这个处理须要排序,总计等操做. 若是能经过 WHERE 子句限制记录的数目,那就能减小这方面的开销.
低效:
Select tab_name from tables where tab_name = ( select
tab_name from tab_columns where version = 604) and db_ver=
( select db_ver from tab_columns where version = 604)
高效:
select tab_name from tables where (tab_name,db_ver) =
( select tab_name,db_ver) from tab_columns where version =604)
低效:
Select.. from location where loc_id = 10 or loc_id = 20 or loc_id = 30
高效:
Select..from location where loc_in in (10,20,30);
最高效的删除重复记录的方法
Delete from ur_user_info a
Where a.rowid>(select min(b.rowid)
From ur_user_info b
Where b. uid=a. uid);
带有DISTINCT,UNION,MINUS,INTERSECT,ORDER BY的SQL语句会启动SQL引擎执行耗费资源的排序(SORT)功能. DISTINCT须要一次排序操做, 而其余的至少须要执行两次排序.
例如,一个UNION查询,其中每一个查询都带有GROUP BY子句, GROUP BY会触发嵌入排序(NESTED SORT) ; 这样, 每一个查询须要执行一次排序, 而后在执行UNION时, 又一个惟一排序(SORT UNIQUE)操做被执行并且它只能在前面的嵌入排序结束后才能开始执行. 嵌入的排序的深度会大大影响查询的效率.
若是表中有两个以上(包括两个)索引,其中有一个惟一性索引,而其余是非惟一性.在这种状况下,ORACLE将使用惟一性索引而彻底忽略非惟一性索引.
举例:
select ename from emp where empno = 2326 and deptno = 20 ;这里,只有empno上的索引是惟一性的,因此empno索引将用来检索记录.
table access by rowid on emp index unique scan on emp_no_idx;
若是索引是创建在多个列上, 只有在它的第一个列(leading column)被where子句引用时,优化器才会选择使用该索引. 当仅引用索引的第二个列时,优化器使用了全表扫描而忽略了索引。
低效:
select ..
from dept
where sal * 12 > 25000;
高效:
select ..
from dept
where sal > 25000/12;
当比较不一样数据类型的数据时, ORACLE自动对列进行简单的类型转换.
假设EMP_TYPE是一个字符类型的索引列.
select user_no,user_name,address
from user_files
where user_no = 109204421
这个语句被ORACLE转换为:
select user_no,user_name,address
from user_files
where to_number(user_no) = 109204421由于内部发生的类型转换, 这个索引将不会被用到!
如用 :
where a.order_no = b.order_no
不用 :
where to_number (substr(a.order_no, instr(b.order_no, '.') - 1)
= to_number (substr(a.order_no, instr(b.order_no, '.') - 1)
例如:
select count(*) sum(sal)
from emp
where dept_no = 0020
and ename like 'smith%';
select count(*) sum(sal)
from emp
where dept_no = 0030
and ename like 'smith%';
你能够用DECODE函数高效地获得相同结果
select count(decode(dept_no, 0020, 'x', null)) d0020_count,
count(decode(dept_no, 0030, 'x', null)) d0030_count,
sum(decode(dept_no, 0020, sal, null)) d0020_sal,
sum(decode(dept_no, 0030, sal, null)) d0030_sal
from emp
where ename like 'smith%';
低效
select tab_name
from tables
where tab_name = ( select tab_name
from tab_columns
where version = 604)
and db_ver= ( select db_ver
from tab_columns
where version = 604)
高效
select tab_name
from tables
where (tab_name,db_ver)
= ( select tab_name,db_ver)
from tab_columns
where version = 604)
(a).ORDER BY语句决定了Oracle如何将返回的查询结果排序。Order by语句对要排序的列没有什么特别的限制,也能够将函数加入列中(象联接或者附加等)。任何在Order by语句的非索引项或者有计算表达式都将下降查询速度。
(b). order by语句以找出非索引项或者表达式,它们会下降性能。解决这个问题的办法就是重写order by语句以使用索引,也能够为所使用的列创建另一个索引,同时应绝对避免在order by子句中使用表达式。
索引是表的一个概念部分,用来提升检索数据的效率,ORACLE使用了一个复杂的自平衡B-tree结构. 一般,经过索引查询数据比全表扫描要快. 当ORACLE找出执行查询和Update语句的最佳路径时, ORACLE优化器将使用索引. 一样在联结多个表时使用索引也能够提升效率. 另外一个使用索引的好处是,它提供了主键(primary key)的惟一性验证。一般, 在大型表中使用索引特别有效. 固然,你也会发现, 在扫描小表时,使用索引一样能提升效率. 虽然使用索引能获得查询效率的提升,可是咱们也必须注意到它的代价. 索引须要空间来存储,也须要按期维护, 每当有记录在表中增减或索引列被修改时, 索引自己也会被修改. 这意味着每条记录的INSERT , DELETE , UPDATE将为此多付出4 , 5 次的磁盘I/O . 由于索引须要额外的存储空间和处理,那些没必要要的索引反而会使查询反应时间变慢.。按期的重构索引是有必要的。
WHERE子句中,若是索引列是函数的一部分.优化器将不使用索引而使用全表扫描.
低效:
SELECT … FROM DEPT WHERE SAL * 12 > 25000;
高效:
SELECT … FROM DEPT WHERE SAL > 25000/12;
若是DEPTNO上有一个索引。
高效:
SELECT *
FROM EMP
WHERE DEPTNO >=4
低效:
SELECT *
FROM EMP
WHERE DEPTNO >3
例子:
select * from employee where salary <> 3000;
对这个查询,能够改写为不使用NOT:
select * from employee where salary<3000 or salary>3000;
虽然这两种查询的结果同样,可是第二种查询方案会比第一种查询方案更快些。第二种查询容许Oracle对salary列使用索引,而第一种查询则不能使用索引。
好比有的表PHONE_NO字段是CHAR型,并且建立有索引,
但在WHERE条件中忘记了加引号,就不会用到索引。
WHERE PHONE_NO=‘13920202022’
WHERE PHONE_NO=13920202022
四.优化总结 |
a.建立表的时候。应尽可能创建主键,尽可能根据实际须要调整数据表的PCTFREE和PCTUSED参数;大数据表删除,用truncate table代替delete。
b. 合理使用索引,在OLTP应用中一张表的索引不要太多。数据重复量大的列不要创建二叉树索引,能够采用位图索引;组合索引的列顺序尽可能与查询条件列顺序保持一致;对于数据操做频繁的表,索引须要按期重建,以减小失效的索引和碎片。
c.查询尽可能用肯定的列名,少用*号。
select count(key)from tab where key> 0性能优于select count(*)from tab;
d. 尽可能少嵌套子查询,这种查询会消耗大量的CPU资源;对于有比较多or运算的查询,建议分红多个查询,用union all联结起来;多表查询的查询语句中,选择最有效率的表名顺序。Oracle解析器对表解析从右到左,因此记录少的表放在右边。
e.尽可能多用commit语句提交事务,能够及时释放资源、解锁、释放日志空间、减小管理花费;在频繁的、性能要求比较高的数据操做中,尽可能避免远程访问,如数据库链等,访问频繁的表能够常驻内存:alter table...cache;
f.在Oracle中动态执行SQL,尽可能用execute方式,不用dbms_sql包。
《Oracle SQL 语句优化》 2010 做者:Black_Snail
《基于Oracle的SQL优化典型案例分析》2013做者:dbsnake @dbsnake