自从16年以后,由于工做缘由,项目中就没有再使用oracle了,最近最近支持一个项目,又要开始负责这块事情了。最近在跑性能测试,配置所有调好以后,很多sql还存在性能低下的问题,主要涉及执行计划的不合理,以及相关pga隐含参数的优化。可能由于几年不接触的缘由,略微有些生疏须要review了。这里以最近优化过的某个比较典型的例子为例(这里只讲思路、由于涉及到敏感信息,不给出最终结果,16C E5620@2.40GHz/45GB内存/fio 85/15 iops 8500/1500 配置,优化前100G临时空间都爆掉,到20分钟出结果,实际上容许彻底调整的话,最多5分钟就能够运行出来),这个例子比较经典,它是一个产品转换的例子,从业务逻辑上来看,它须要对两个100w(100管理人*1w支产品)记录的结果集进行黑名单(是指A产品->B产品是否容许转换,A->B不容许,不意味着B->A不容许)之外的笛卡尔积关联,,重点回顾下一些重要的operation以及如何经过hint强制,子查询独立运行时的operation和做为主查询的子查询运行时的operation不相同可能会形成性能差别巨大。首先,不要期望写一段sql,既能够在oracle下运行、也能够在mysql下运行。原始的sql语句以及执行计划以下:html
INSERT INTO C3( tenantid,c_code,l_serialno,c_txtfundcode, c_chargetype,f_sharemin,f_sharemax,l_hold,c_txtothercode, c_targetchargetype,c_custtype,c_flag,d_operatedate,d_cdate,c_cyno) SELECT a.tenantid,a.c_code,l_serialno, CASE a.agencytypes WHEN 'AB' THEN a.c_prdcode ELSE COALESCE(b.c_outprdcode,a.c_prdcode) END c_txtfundcode, c_chargetype,f_sharemin,f_sharemax,l_hold, CASE a.agencytypes WHEN 'AB'THEN a.c_othercode ELSE COALESCE(c.c_outprdcode,a.c_othercode) END c_txtothercode, c_targetchargetype,c_custtype,c_flag,d_operatedate,20100511 d_cdate,a.c_cyno FROM (SELECT 0 l_serialno, CASE t.c_mutextype WHEN 'A' THEN '0' WHEN 'B' THEN '1' WHEN 'C' THEN '2' ELSE t.c_mutextype END c_chargetype, CASE t.c_targetsharetype WHEN 'A' THEN '0' WHEN 'B' THEN '1' WHEN 'C' THEN '2' ELSE t.c_targetsharetype END c_targetchargetype, ar.f_cminmutex f_sharemin,99999999999999.9 f_sharemax,0 l_hold,'2' c_custtype, '1' c_flag,'20000101' d_operatedate, t.* FROM (SELECT fo.tenantid, fo.c_code, fo.c_prdcode,fi.c_prdcode c_othercode, fo.c_cyno,fo.c_mutextype,fi.c_mutextype c_targetsharetype, fo.d_contractdate d_contractdate, fo.c_mutextypes c_mutextypes, fo.agencytypes, fi.d_contractdate d_othercontractdate, fi.c_mutextypes c_othersharetypes FROM (SELECT DISTINCT ss.tenantid, ss.c_code, ss.c_prdcode, ss.c_cyno,ss.c_mutextype c_mutextype, ta.c_mutextypes agencytypes, getsysvalue(ss.tenantid, ss.c_code, ss.c_cyno,ss.c_managercode, ss.c_prdcode,'ContractDate', '20991231') d_contractdate, getsysvalue(ss.tenantid, ss.c_code, ss.c_cyno,ss.c_managercode, ss.c_prdcode,'ShareTypes', '') c_mutextypes FROM (SELECT fi.tenantid, fi.c_code, fi.c_prdcode,c.c_cyno, s.c_mutextype, fi.c_managercode FROM FUNDINFO fi, (SELECT 'A' c_mutextype FROM DUAL UNION ALL SELECT 'B' c_mutextype FROM DUAL UNION ALL SELECT 'C' c_mutextype FROM DUAL) s, QUALIFY c, EXPBATCH d WHERE fi.c_code = 'F6' AND fi.tenantid = '*' AND fi.c_fundstatus NOT IN ('6', '9') AND c.c_code = 'F6' AND c.tenantid = '*' AND c.c_cyno = d.c_cyno AND c.c_code = d.c_code AND c.tenantid = d.tenantid AND INSTR(fi.c_mutextypes, s.c_mutextype) > 0 AND (fi.c_fundtype<>'1' OR NOT EXISTS(SELECT 1 FROM TEXT_PARAMETER WHERE c_paramitem = 'ChangeLimit' AND c_paramvalue = '1' AND c_prdcode = fi.c_prdcode AND c_code = 'F6' AND tenantid = '*')) AND fi.c_prdcode = c.c_prdcode AND c.c_issaleflag = '1' ) ss, EXPBATCH ta WHERE ss.c_cyno = ta.c_cyno AND ss.c_code = ta.c_code AND ss.tenantid = ta.tenantid AND ta.c_notexpparamfiles = '0' ) fo, (SELECT DISTINCT ss.tenantid, ss.c_code, ss.c_prdcode, ss.c_cyno,ss.c_mutextype c_mutextype, getsysvalue(ss.tenantid, ss.c_code, ss.c_cyno,ss.c_managercode, ss.c_prdcode,'ContractDate', 20991231) d_contractdate, getsysvalue(ss.tenantid, ss.c_code, ss.c_cyno,ss.c_managercode, ss.c_prdcode,'ShareTypes', '') c_mutextypes FROM (SELECT fi.tenantid, fi.c_code, fi.c_prdcode, c.c_cyno, s.c_mutextype, fi.c_managercode FROM FUNDINFO fi, (SELECT 'A' c_mutextype FROM DUAL UNION ALL SELECT 'B' c_mutextype FROM DUAL UNION ALL SELECT 'C' c_mutextype FROM DUAL) s, QUALIFY c, EXPBATCH d WHERE fi.c_code = 'F6' AND fi.tenantid = '*' AND c.c_code = 'F6' AND c.tenantid = '*' AND c.c_cyno = d.c_cyno AND c.c_code = d.c_code AND c.tenantid = d.tenantid AND INSTR(fi.c_mutextypes, s.c_mutextype) > 0 AND fi.c_fundstatus NOT IN ('6', '9') AND (fi.c_fundtype <> '1' OR NOT EXISTS (SELECT 1 FROM TEXT_PARAMETER WHERE c_paramitem = 'ChangeLimit' AND c_paramvalue = '1' AND c_prdcode = fi.c_prdcode AND c_code = 'F6' AND tenantid = '*')) AND fi.c_prdcode = c.c_prdcode AND c.c_issaleflag = '1' ) ss, EXPBATCH ta WHERE ss.c_cyno = ta.c_cyno AND ss.c_code = ta.c_code AND ss.tenantid = ta.tenantid AND ta.c_notexpparamfiles = '0' ) fi WHERE fo.c_prdcode <> fi.c_prdcode AND fo.c_mutextype = fi.c_mutextype AND fo.c_cyno = fi.c_cyno ) t,(SELECT c_prdcode, c_cyno, MIN(a.f_cminmutex) f_cminmutex FROM ARLIMIT a WHERE c_cyno <> '*' AND c_code = 'F6' AND tenantid = '*' GROUP BY c_prdcode, c_cyno UNION ALL SELECT c_prdcode, b.c_cyno, MIN(f_cminmutex) f_cminmutex FROM ARLIMIT a, EXPBATCH b WHERE a.c_cyno = '*' AND a.c_code = 'F6' AND a.tenantid = '*' AND a.c_code = b.c_code AND a.tenantid = b.tenantid AND not exists (SELECT 1 FROM ARLIMIT c WHERE b.c_cyno = c.c_cyno AND a.c_prdcode = c.c_prdcode AND a.c_code = c.c_code AND a.tenantid = c.tenantid) GROUP BY c_prdcode, b.c_cyno) ar WHERE t.d_contractdate <= 20100511 AND t.d_othercontractdate <= 20100511 AND INSTR(t.c_mutextypes, t.c_mutextype) > 0 AND INSTR(t.c_othersharetypes, t.c_targetsharetype) > 0 AND t.c_prdcode = ar.c_prdcode AND t.c_cyno = ar.c_cyno AND NOT EXISTS (SELECT 1 FROM CHANGELIMIT b WHERE t.c_prdcode = b.c_prdcode AND (t.c_mutextype = b.c_mutextype OR b.c_mutextype = '*') AND (t.c_cyno = b.c_cyno OR b.c_cyno = '*') AND (t.c_othercode = b.c_othercode OR b.c_othercode = '*') AND (t.c_targetsharetype = b.c_othershare OR b.c_othershare = '*') ) ) a LEFT JOIN FUNDCODECHANGE b ON (a.c_prdcode = b.c_prdcode AND a.c_mutextype = b.c_mutextype AND a.c_code = b.c_code AND a.tenantid = b.tenantid) LEFT JOIN FUNDCODECHANGE c ON (a.c_othercode = c.c_prdcode AND a.c_targetsharetype = c.c_mutextype AND a.c_code = c.c_code AND a.tenantid = c.tenantid)
-- 此处隐藏了谓词部分 Plan Hash Value : 4256998962 -------------------------------------------------------------------------------------------------------------------------- | Id | Operation | Name | Rows | Bytes | Cost | Time | -------------------------------------------------------------------------------------------------------------------------- | 0 | INSERT STATEMENT | | 1 | 129 | 2103 | 00:00:26 | | 1 | LOAD TABLE CONVENTIONAL | C3 | | | | | | 2 | NESTED LOOPS OUTER | | 1 | 129 | 2103 | 00:00:26 | | 3 | VIEW | | 1 | 95 | 2102 | 00:00:26 | | * 4 | FILTER | | | | | | | * 5 | HASH JOIN | | 1 | 8105 | 2101 | 00:00:26 | | * 6 | HASH JOIN | | 1 | 8078 | 1827 | 00:00:22 | | 7 | NESTED LOOPS OUTER | | 1 | 4060 | 914 | 00:00:11 | | 8 | VIEW | | 1 | 4026 | 913 | 00:00:11 | | 9 | SORT UNIQUE | | 1 | 72 | 913 | 00:00:11 | | * 10 | FILTER | | | | | | | 11 | NESTED LOOPS | | 1 | 72 | 912 | 00:00:11 | | 12 | NESTED LOOPS | | 1 | 72 | 912 | 00:00:11 | | 13 | NESTED LOOPS | | 1 | 58 | 911 | 00:00:11 | | 14 | NESTED LOOPS | | 1 | 49 | 910 | 00:00:11 | | 15 | NESTED LOOPS | | 1500 | 46500 | 309 | 00:00:04 | | 16 | VIEW | | 3 | 9 | 6 | 00:00:01 | | 17 | UNION-ALL | | | | | | | 18 | FAST DUAL | | 1 | | 2 | 00:00:01 | | 19 | FAST DUAL | | 1 | | 2 | 00:00:01 | | 20 | FAST DUAL | | 1 | | 2 | 00:00:01 | | * 21 | TABLE ACCESS FULL | FUNDINFO | 500 | 14000 | 101 | 00:00:02 | | * 22 | TABLE ACCESS BY INDEX ROWID | QUALIFY | 1 | 18 | 1 | 00:00:01 | | * 23 | INDEX RANGE SCAN | UIDX_QUALIFY | 1 | | 1 | 00:00:01 | | * 24 | INDEX RANGE SCAN | PK_BATCH | 1 | 9 | 1 | 00:00:01 | | * 25 | INDEX RANGE SCAN | PK_EXPBATCH | 1 | | 1 | 00:00:01 | | * 26 | TABLE ACCESS BY INDEX ROWID | EXPBATCH | 1 | 14 | 1 | 00:00:01 | | * 27 | INDEX RANGE SCAN | IDX_TEXTPARAMETER_VALUE | 1 | 30 | 1 | 00:00:01 | | * 28 | TABLE ACCESS BY INDEX ROWID | FUNDCODECHANGE | 1 | 34 | 1 | 00:00:01 | | * 29 | INDEX UNIQUE SCAN | PK_FUNDCODECHANGE | 1 | | 1 | 00:00:01 | | 30 | VIEW | | 1 | 4018 | 913 | 00:00:11 | | 31 | SORT UNIQUE | | 1 | 69 | 913 | 00:00:11 | | * 32 | FILTER | | | | | | | 33 | NESTED LOOPS | | 1 | 69 | 912 | 00:00:11 | | 34 | NESTED LOOPS | | 1 | 69 | 912 | 00:00:11 | | 35 | NESTED LOOPS | | 1 | 58 | 911 | 00:00:11 | | 36 | NESTED LOOPS | | 1 | 49 | 910 | 00:00:11 | | 37 | NESTED LOOPS | | 1500 | 46500 | 309 | 00:00:04 | | 38 | VIEW | | 3 | 9 | 6 | 00:00:01 | | 39 | UNION-ALL | | | | | | | 40 | FAST DUAL | | 1 | | 2 | 00:00:01 | | 41 | FAST DUAL | | 1 | | 2 | 00:00:01 | | 42 | FAST DUAL | | 1 | | 2 | 00:00:01 | | * 43 | TABLE ACCESS FULL | FUNDINFO | 500 | 14000 | 101 | 00:00:02 | | * 44 | TABLE ACCESS BY INDEX ROWID | QUALIFY | 1 | 18 | 1 | 00:00:01 | | * 45 | INDEX RANGE SCAN | UIDX_QUALIFY | 1 | | 1 | 00:00:01 | | * 46 | INDEX RANGE SCAN | PK_EXPBATCH | 1 | 9 | 1 | 00:00:01 | | * 47 | INDEX RANGE SCAN | PK_EXPBATCH | 1 | | 1 | 00:00:01 | | * 48 | TABLE ACCESS BY INDEX ROWID | EXPBATCH | 1 | 11 | 1 | 00:00:01 | | * 49 | INDEX RANGE SCAN | IDX_TEXTPARAMETER_VALUE | 1 | 30 | 1 | 00:00:01 | | 50 | VIEW | | 7073 | 190971 | 274 | 00:00:04 | | 51 | UNION-ALL | | | | | | | 52 | SORT GROUP BY | | 1 | 16 | 20 | 00:00:01 | | 53 | TABLE ACCESS BY INDEX ROWID | ARLIMIT | 1 | 16 | 20 | 00:00:01 | | * 54 | INDEX FULL SCAN | UIDX_ARLIMIT | 1 | | 20 | 00:00:01 | | 55 | SORT GROUP BY | | 7072 | 275808 | 254 | 00:00:04 | | * 56 | HASH JOIN RIGHT ANTI | | 2970075 | 115832925 | 175 | 00:00:03 | | * 57 | INDEX FULL SCAN | UIDX_ARLIMIT | 30000 | 420000 | 20 | 00:00:01 | | * 58 | HASH JOIN | | 2970075 | 74251875 | 146 | 00:00:02 | | * 59 | INDEX FULL SCAN | PK_EXPBATCH | 99 | 891 | 1 | 00:00:01 | | * 60 | TABLE ACCESS FULL | ARLIMIT | 30000 | 480000 | 137 | 00:00:02 | | * 61 | TABLE ACCESS BY INDEX ROWID | CHANGELIMIT | 1 | 28 | 1 | 00:00:01 | | * 62 | INDEX RANGE SCAN | IDX_CHANGELIMIT_FUNDCODE | 90 | | 1 | 00:00:01 | | * 63 | TABLE ACCESS BY INDEX ROWID | FUNDCODECHANGE | 1 | 34 | 1 | 00:00:01 | | * 64 | INDEX UNIQUE SCAN | PK_FUNDCODECHANGE | 1 | | 1 | 00:00:01 | --------------------------------------------------------------------------------------------------------------------------
这里不会讲基础优化,好比何时用hash join,何时nl,lio怎么看,access method,join method,fiter,predicate等基础优化知识。java
在某些状况下,查询有left join时,使用了parallel会致使查询一直出不来,不用parallel反而马上能够出来。mysql
在不少场景中,parallel提高性能颇有限、甚至下降了性能以及并行执行中的buffer sort。在并行的执行计划中,咱们能够看到有一步是buffer sort,并且这一步占据了挺长的时间,buffer sort实际上没有排序,只是把数据加载到内存,不扫描屡次表。一般在并行执行中出现这个操做。parallel为何会性能提高有限呢,这其实涉及到oracle内部的算法是尽量大部分场景最优化,这就会致使对于咱们知道有规律的关联消除并无被按预期消除,好比说在咱们的这个优化中,每一个管理人只有1w支产品,不一样管理人之间是没法转换的,可是oracle不知道,即便咱们采用hash分区,且在管理人字段,设置最多100个分区(读者确定会问,为何要使用hash分区而不是list呢?由于这里的管理人数量是不固定的,而咱们使用的是oracle 11.2,若是是12c,就不存在这个问题了,由于12c支持了自动分区,见oracle 12cR1&12cR2核心高实用性新特性),也并非每一个分区一个管理人,不少分区没有数据,因此致使分区间很不均衡,采用并行执行的时候,由于很不均衡,致使执行计划倾斜严重,可能高达40%。同时由于统计信息不必定准确,可能会致使某些时候应该px send hash的成了px send broadcast,这虽然能够经过pq_distriubte hint强制,可是因为优化器会在hint基础上进一步进行查询转换(尤为涉及到子查询套子查询的时候),也可能会致使非预期的状况。实际上,对于超过三五个表以上复杂的sql,parallel效果就不佳的,这种状况,其实应该是应用里面发起多线程并行请求,采用fork-join模式来达到并行执行的效果。这一点只有掌握具体数据库好比oracle/mysql优化原理(oracle作获得的mysql不必定作获得,反过来通常不成立)和实现的架构师作获得。最后,笔者会讲到,本例是应该在设计上进行优化而不是单独的oracle和sql优化的。c++
- 执行计划相同,select很快,insert select很慢。好比帖子https://bbs.csdn.net/topics/370166028提到问题。对于结果记录成千上万的查询,须要知道select只是fetch了前面几行(即便优化器模式是all_rows),fetch也是要消耗lio的,因此若是不想insert 验证下大概时间,至少须要select count(1) from (select /*+ no_merge*/ from ...),这样才能获得相对比较合理的值(这个值可能和实际insert相差50%-100%之间,主要视数据量以及磁盘的速度而定)。有时候可能count(1)也很快,insert就很慢,执行计划又是彻底相同的,这该怎么办呢,结果数据量也不大,也就两三百万而已???还没细看,最近真遇到这个例子了,
- oracle insert select和select执行计划不一样。参考insert select和select执行计划不一样。
- 主查询中某子查询的执行计划和子查询独立执行的执行计划不一样。颇有可能在子查询独立执行的时候,表之间的关联采用了hash join,做为主查询子句的时候,就是nl了,也有可能hash group by 变成了sort group by。这一点能够考虑使用with子句+materialize或者no_merge以及其余hint来控制住。
- 多with子句,只有第一个被物化为临时表。之前没注意,此次发现有多个with的时候,只有第一个被物化,后面的都没有被物化,虽然都加上了/*+ materialize */提示。若是实在没法控制执行计划,就考虑建立个临时表吧(惋惜oracle 12c以前,gtt和常规表同样会产生大量的undo,oracle 12c引入了临时undo表空间,能够极大的规避redo/undo的生成)。测试可见http://blog.itpub.net/7199859/viewspace-1150868/。
- not exist中有and致使优化器选择了filter。filter从实现上跟nl差很少,对于主查询成千上万的查询,极可能一个filter就查询不出来或者严重影响性能。一般not exist中会出现相似下列的语句:
and not exists (select /*+ qb_name(inn)*/* from inner_table inn where (inn.status = outer_table.status or inn.status = '1') and xxx)算法
对于这种状况,anti join就失效了,虽然可让主查询使用nl加上/*+ push_subq(@inn) */来pushdown查询条件,以免主查询使用hash join产生巨量中间结果,可是nl对于大表性能极为低下。此时能够考虑将not exists拆分为以下:sql
and not exists (select * from inner_table inn where (inn.status = '1') and xxx)数据库
and not exists (select * from inner_table inn where (inn.status = outer_table.status or inn.status = '1') and xxx)服务器
此时可能就能够作到第一个not exists采用hash anti过滤掉大部分最终结果不须要的数据集。session
- exist中有or致使优化器选择了filter。对于exists,一般状况以下:
and exists (outer_table.status = '1' or select 1 from another_table x where x.type = outer_table.type and ... )mysql优化
对于这类查询,能够考虑使用union实现,可是有些时候,union并不见得合适,好比说查询上使用了分析函数就不合适了。此时就须要考虑其余方法(由于在咱们的另外一个sql中,结果集还不算大,因此也就没有进一步优化)。
- 在java/c++中运行很慢,拷贝到pl/sql dev中执行就很快。其实了解oracle/mysql优化器原理的都知道绑定变量的概念,因此这就不足为奇了,要在pl/sql dev中彻底模拟代码中的行为,要么使用sql*plus的绑定变量,要么放到存储过程(pl/sql默认绑定变量,除非使用execute immediate)中执行,就模拟了在代码中的行为。
- hash group by vs sort group by。hash group by 与 sort group by的区别,能够参考http://www.itpub.net/thread-1813825-1-1.html,要强制指定使用hash group by,可使用
/*+ NO_USE_HASH_AGGREGATION */提示。
- SQL中调用了自定义函数时性能低下之。在sql语句中调用自定义函数是一大禁忌,内置函数之因此几乎感受不大太大的性能,是由于内置函数好比upper/lower都是肯定性函数,也就是对于相同输入、老是产生相同输出,实际上在一个sql语句中,咱们调用自定义函数的时候,作的一般都是相似参数/翻译相关的功能,因为涉及到多个级别的优先级问题,因此一个sql语句实现较为复杂,因此在这个sql执行期间,一般不会是相同的输入、产生不一样的输出,此时将自定义函数设置为DETERMINISTIC,在某些状况下,能够极大的提高性能(视在这个SQL执行期间,有多少比例的重复输入而定)。可是,若是几乎没有重复的输入,此时硬是将exists/not exists改成DETERMINISTIC自定义函数,将是悲剧。。
- pga优化。workarea_size_policy模式下主要是pga_aggregate_target、_smm_px_max_size、_smm_max_size、_pga_max_size这四个参数,肯定pga是否足够只要查询v$sql_plan_statistics_all,查看ONEPASS_EXECUTIONS、MULTIPASSES_EXECUTIONS、LAST_TEMPSEG_SIZE、MAX_TEMPSEG_SIZE这4个字段,只要MULTIPASSES_EXECUTIONS、LAST_TEMPSEG_SIZE、MAX_TEMPSEG_SIZE都为空或者0就能够保证pga足够。
- $session.event监控并优化服务器配置。当运行时间比较长的时候,咱们须要查询下v$session看下该进程当前在等待什么事件,根据此进一步肯定是终止执行仍是查看os的当前状况。
- v$session_longops。对于并行执行(非并行执行不会体现),能够经过该视图预估语句还须要执行多久,通常来讲仍是比较可靠的。
- sar -d -p 5 10000。能够监控各个磁盘的饱和度状况,以下:
%util 90%以上就说明当前磁盘太忙,要么布局不合理,要么太慢了。
- 问题颇有可能在应用架构设计上,这事情已经超出了oracle的范围。分而治之不是数据库自身擅长的,这属于应用设计的一部分,虽然相似分区、parallel算是分而自治的理念,可是它毕竟不知道业务上下文的特殊性,因此,对于这个sql,应该在SQL优化的基础上,5或者10或者20个管理人做为条件,开管理人总数/每次处理的管理人做为线程数,采用fork-join模式实现,不管应用层是java仍是c++均可以较为简单的实现,三五分钟彻底是能够实现的(181114,咱们最近将mysql版本进行了应用架构层的优化,将执行时间从27分钟下降到了8分钟,跑的比oracle还快)。
- 对于复杂的sql,建议加上/*+ gather_plan_statistics */提示以便在v$sql_plan_statistics_all中收集实际的逻辑读、物理读、基数等值,以便进一步优化执行计划。