Oracle优化技巧

时间 2019-12-01

标签 oracle 优化技巧栏目 Oracle 繁體版

原文原文链接

现观察线上系统运行发现，线上某些业务查询存在等待时间长问题，后核查发现，部分问题出如今对数据库操做上Cost大部分时间，后根据网上各位前辈提供的优化技巧解决大部分问题，现写下本篇文章，一来巩固加深本身学习的优化技巧，二来方便正在为sql优化迷茫的猿友们提供一下思路和方法，共同进步，一块儿成长~

一、现状描述

sql执行时间长、数据查询慢

二、问题对象

sql执行语句（特别是多表多条件关联查询数据）

三、理论知识

一、Oracle优化器

Oracle优化器：Oracle数据库中的优化器又叫查询优化器（QueryOptimizer）。它是SQL分析和执行的优化工具，它负责生成、制定SQL的执行计划。
    
Oracle优化器优化方式
基于规则的优化方式(Rule-BasedOptimization,简称为RBO)
    它根据指定的规则顺序，对指定的表进行执行计划的选择。它着一套严格的使用规则，只要你按照它去写SQL语句，不管数据表中的
内容怎样，也不会影响到你的“执行计划”，也就是说RB对数据不“敏感”。要求开发人员了解RBO的各项细则。在ORACLE 
10g中彻底被CBO取代。

基于代价的优化方式(Cost-Based Optimization,简称为CBO)。
    CBO是一种比RBO更加合理、可靠的优化器，它是从ORACLE 8中开始引入，在ORACLE10g中彻底取代RBO。CBO是计算各类可能“执行
计划”的“代价”，即COST，从中选用COST最低的执行方案，做为实际运行方案。它依赖数据库对象的统计信息，统计信息的准确与否会影响C
BO作出最优的选择。若是对一次执行SQL时发现涉及对象（表、索引等）没有被分析、统计过，那么ORACLE会采用一种叫作动态采样的技术，
动态的收集表和索引上的一些数据信息。

二、Oracle索引

Oracle索引是一种供服务器在表中快速查找一个行的数据库结构。合理使用索引可以大大提升数据库的运行效率。
在Oracle中，索引是一种供服务器在表中快速查找一个行的数据库结构。在数据库中创建索引主要有如下做用。
（1）快速存取数据。
（2）既能够改善数据库性能，又能够保证列值的惟一性。
（3）实现表与表之间的参照完整性
（4）在使用order by、group by子句进行数据检索时，利用索引能够减小排序和分组的时间。

　　三、优化方向

a、去掉没必要要的大型表的全表扫描
b、去掉没必要要的大型表的全表扫描
c、缓存小型表的全表扫描
d、检验优化索引的使用
e、检验优化的链接技术
f、尽量减小执行计划的Cost

四、具体优化方法

一、查询条件（where后面的子句）优化

避免全表扫描，应考虑在where及order by等列上创建索引，不然将致使进行全表扫描。。

避免在where子句中对字段进行null值判断，不然将致使放弃使用索引而进行全表扫描。

避免在where子句中使用！=或<>操做符，不然将致使放弃使用索引而进行全表扫描。

避免用or链接条件，若是有部分字段存在索引，部分不存在索引，则将致使放弃使用索引而进行全表扫描，建议使用union all代替。

慎用in 和 not in 也要慎用，不然会致使全表扫描。
     使用exists替换in问题
        子查询结果集小，用IN
        外表小，子查询表大，用EXISTS
    建议实际选取哪一个能够对比两个sql的执行计划

应尽可能避免在 where 子句中对字段进行表达式操做，这将致使引擎放弃使用索引而进行全表扫描。如： 
SELECT ID FROM T WHERE NUM / 2 = 100
优化为：
SELECT ID FROM T WHERE NUM = 100 * 2

应尽可能避免在where子句中对字段进行函数函数、算术运算或其余表达式运算操做，不然将致使放弃使用索引而进行全表扫描。如：
-- NAME以ABC开头的ID
SELECT ID FROM T WHERE SUBSTRING(NAME, 1, 3) = ’ABC’ 
--2005-11-30’生成的id
SELECT ID FROM T WHERE DATEDIFF(DAY, CREATEDATE, ’2005 - 11 - 30′) = 0
应改成:
SELECT ID FROM T WHERE NAME LIKE 'abc%'
SELECT ID FROM T WHERE CREATEDATE >= '2005-11-30' AND CREATEDATE < '2005-12-1'

二、对结果进行优化

Update 语句，若是只更改一、2个字段，不要Update所有字段，不然频繁调用会引发明显的性能消耗，同时带来大量日志。

对于多张大数据量（这里几百条就算大了）的表JOIN，要先分页再JOIN，不然逻辑读会很高，性能不好。

select count(*) from table；这样不带任何条件的count会引发全表扫描，而且没有任何业务意义，是必定要杜绝的。

尽可能避免向客户端返回大数据量，若数据量过大，应该考虑是否使用分页

三、其余优化

索引并非越多越好，索引当然能够提升相应的 select 的效率，但同时也下降了 insert 及 update 的效率，由于 insert 或 
update 时有可能会重建索引，因此怎样建索引须要慎重考虑，视具体状况而定。一个表的索引数最好不要超过6个，若太多则应考虑一些不常使用到
的列上建的索引是否有必要。

应尽量的避免更新汇集索引（clustered）数据列，由于汇集索引数据列的顺序就是表记录的物理存储顺序，一旦该列值改变将致使整个表记录的
顺序的调整，会耗费至关大的资源。若应用系统须要频繁更新集索引数据列，那么须要考虑是否应将该索引建为汇集索引

尽可能使用数字型字段，若只含数值信息的字段尽可能不要设计为字符型，这会下降查询和链接的性能，并会增长存储开销。这是由于引擎在处理查询
和链接时会逐个比较字符串中每个字符，而对于数字型而言只须要比较一次就够了。

尽可能使用表变量来代替临时表。若是表变量包含大量数据，请注意索引很是有限（只有主键索引）。

避免频繁建立和删除临时表，以减小系统表资源的消耗。临时表并非不可以使用，适当地使用它们可使某些例程更有效，例如，当须要重复引用
大型表或经常使用表中的某个数据集时。可是，对于一次性事件， 最好使用导出表。

在新建临时表时，若是一次性插入数据量很大，那么可使用 select into 代替 create table，避免形成大量 
log，以提升速度；若是数据量不大，为了缓和系统表的资源，应先create table，而后insert。

若是使用到了临时表，在存储过程的最后务必将全部的临时表显式删除，先 truncate table ，而后 drop table 
，这样能够避免系统表的较长时间锁定。

尽可能避免使用游标，由于游标的效率较差，若是游标操做的数据超过1万行，那么就应该考虑改写。

使用基于游标的方法或临时表方法以前，应先寻找基于集的解决方案来解决问题，基于集的方法一般更有效。
与临时表同样，游标并非不可以使用。对小型数据集使用 FAST_FORWARD 游标一般要优于其余逐行处理方法，尤为是在必须引用几个表才能得到所
需的数据时。在结果集中包括“合计”的例程一般要比使用游标执行的速度快。若是开发时 
间容许，基于游标的方法和基于集的方法均可以尝试一下，看哪种方法的效果更好。

在全部的存储过程和触发器的开始处设置 SET NOCOUNT ON ，在结束时设置 SET NOCOUNT OFF 
。无需在执行存储过程和触发器的每一个语句后向客户端发送 DONE_IN_PROC 消息。

尽可能避免大事务操做，提升系统并发能力。