Oracle优化技巧

现观察线上系统运行发现,线上某些业务查询存在等待时间长问题,后核查发现,部分问题出如今对数据库操做上Cost大部分时间,后根据网上各位前辈提供的优化技巧解决大部分问题,现写下本篇文章,一来巩固加深本身学习的优化技巧,二来方便正在为sql优化迷茫的猿友们提供一下思路和方法,共同进步,一块儿成长~

一、现状描述

sql执行时间长、数据查询慢

二、问题对象

sql执行语句(特别是多表多条件关联查询数据)

三、理论知识

一、Oracle优化器
Oracle优化器:Oracle数据库中的优化器又叫查询优化器(QueryOptimizer)。它是SQL分析和执行的优化工具,它负责生成、制定SQL的执行计划。
    
Oracle优化器优化方式
基于规则的优化方式(Rule-BasedOptimization,简称为RBO)
    它根据指定的规则顺序,对指定的表进行执行计划的选择。它着一套严格的使用规则,只要你按照它去写SQL语句,不管数据表中的
内容怎样,也不会影响到你的“执行计划”,也就是说RB对数据不“敏感”。要求开发人员了解RBO的各项细则。在ORACLE 
10g中彻底被CBO取代。

基于代价的优化方式(Cost-Based Optimization,简称为CBO)。
    CBO是一种比RBO更加合理、可靠的优化器,它是从ORACLE 8中开始引入,在ORACLE10g中彻底取代RBO。CBO是计算各类可能“执行
计划”的“代价”,即COST,从中选用COST最低的执行方案,做为实际运行方案。它依赖数据库对象的统计信息,统计信息的准确与否会影响C
BO作出最优的选择。若是对一次执行SQL时发现涉及对象(表、索引等)没有被分析、统计过,那么ORACLE会采用一种叫作动态采样的技术,
动态的收集表和索引上的一些数据信息。
二、Oracle索引
Oracle索引是一种供服务器在表中快速查找一个行的数据库结构。合理使用索引可以大大提升数据库的运行效率。
在Oracle中,索引是一种供服务器在表中快速查找一个行的数据库结构。在数据库中创建索引主要有如下做用。
(1)快速存取数据。
(2)既能够改善数据库性能,又能够保证列值的惟一性。
(3)实现表与表之间的参照完整性
(4)在使用order by、group by子句进行数据检索时,利用索引能够减小排序和分组的时间。
  三、优化方向
a、去掉没必要要的大型表的全表扫描
b、去掉没必要要的大型表的全表扫描
c、缓存小型表的全表扫描
d、检验优化索引的使用
e、检验优化的链接技术
f、尽量减小执行计划的Cost

四、具体优化方法

一、查询条件(where后面的子句)优化
避免全表扫描,应考虑在where及order by等列上创建索引,不然将致使进行全表扫描。。

避免在where子句中对字段进行null值判断,不然将致使放弃使用索引而进行全表扫描。

避免在where子句中使用!=或<>操做符,不然将致使放弃使用索引而进行全表扫描。

避免用or链接条件,若是有部分字段存在索引,部分不存在索引,则将致使放弃使用索引而进行全表扫描,建议使用union all代替。

慎用in 和 not in 也要慎用,不然会致使全表扫描。
     使用exists替换in问题
        子查询结果集小,用IN
        外表小,子查询表大,用EXISTS
    建议实际选取哪一个能够对比两个sql的执行计划

应尽可能避免在 where 子句中对字段进行表达式操做,这将致使引擎放弃使用索引而进行全表扫描。如: 
SELECT ID FROM T WHERE NUM / 2 = 100
优化为:
SELECT ID FROM T WHERE NUM = 100 * 2

应尽可能避免在where子句中对字段进行函数函数、算术运算或其余表达式运算操做,不然将致使放弃使用索引而进行全表扫描。如:
-- NAME以ABC开头的ID
SELECT ID FROM T WHERE SUBSTRING(NAME, 1, 3) = ’ABC’ 
--2005-11-30’生成的id
SELECT ID FROM T WHERE DATEDIFF(DAY, CREATEDATE, ’2005 - 11 - 30′) = 0
应改成:
SELECT ID FROM T WHERE NAME LIKE 'abc%'
SELECT ID FROM T WHERE CREATEDATE >= '2005-11-30' AND CREATEDATE < '2005-12-1'
二、对结果进行优化
Update 语句,若是只更改一、2个字段,不要Update所有字段,不然频繁调用会引发明显的性能消耗,同时带来大量日志。

对于多张大数据量(这里几百条就算大了)的表JOIN,要先分页再JOIN,不然逻辑读会很高,性能不好。

select count(*) from table;这样不带任何条件的count会引发全表扫描,而且没有任何业务意义,是必定要杜绝的。

尽可能避免向客户端返回大数据量,若数据量过大,应该考虑是否使用分页
三、其余优化
索引并非越多越好,索引当然能够提升相应的 select 的效率,但同时也下降了 insert 及 update 的效率,由于 insert 或 
update 时有可能会重建索引,因此怎样建索引须要慎重考虑,视具体状况而定。一个表的索引数最好不要超过6个,若太多则应考虑一些不常使用到
的列上建的索引是否有必要。

应尽量的避免更新汇集索引(clustered)数据列,由于汇集索引数据列的顺序就是表记录的物理存储顺序,一旦该列值改变将致使整个表记录的
顺序的调整,会耗费至关大的资源。若应用系统须要频繁更新集索引数据列,那么须要考虑是否应将该索引建为汇集索引

尽可能使用数字型字段,若只含数值信息的字段尽可能不要设计为字符型,这会下降查询和链接的性能,并会增长存储开销。这是由于引擎在处理查询
和链接时会逐个比较字符串中每个字符,而对于数字型而言只须要比较一次就够了。

尽可能使用表变量来代替临时表。若是表变量包含大量数据,请注意索引很是有限(只有主键索引)。

避免频繁建立和删除临时表,以减小系统表资源的消耗。临时表并非不可以使用,适当地使用它们可使某些例程更有效,例如,当须要重复引用
大型表或经常使用表中的某个数据集时。可是,对于一次性事件, 最好使用导出表。

在新建临时表时,若是一次性插入数据量很大,那么可使用 select into 代替 create table,避免形成大量 
log,以提升速度;若是数据量不大,为了缓和系统表的资源,应先create table,而后insert。

若是使用到了临时表,在存储过程的最后务必将全部的临时表显式删除,先 truncate table ,而后 drop table 
,这样能够避免系统表的较长时间锁定。

尽可能避免使用游标,由于游标的效率较差,若是游标操做的数据超过1万行,那么就应该考虑改写。

使用基于游标的方法或临时表方法以前,应先寻找基于集的解决方案来解决问题,基于集的方法一般更有效。
与临时表同样,游标并非不可以使用。对小型数据集使用 FAST_FORWARD 游标一般要优于其余逐行处理方法,尤为是在必须引用几个表才能得到所
需的数据时。在结果集中包括“合计”的例程一般要比使用游标执行的速度快。若是开发时 
间容许,基于游标的方法和基于集的方法均可以尝试一下,看哪种方法的效果更好。

在全部的存储过程和触发器的开始处设置 SET NOCOUNT ON ,在结束时设置 SET NOCOUNT OFF 
。无需在执行存储过程和触发器的每一个语句后向客户端发送 DONE_IN_PROC 消息。

尽可能避免大事务操做,提升系统并发能力。
相关文章
相关标签/搜索