下面就某些SQL语句的where子句编写中须要注意的问题做详细介绍。在这些where子句中,即便某些列存在索引,可是因为编写了劣质的SQL,系统在运行该SQL语句时也不能使用该索引,而一样使用全表扫描,这就形成了响应速度的极大下降。html
1. IS NULL 与 IS NOT NULLjava
不能用null做索引,任何包含null值的列都将不会被包含在索引中。即便索引有多列这样的状况下,只要这些列中有一列含有null,该列就会从索引中排除。也就是说若是某列存在空值,即便对该列建索引也不会提升性能。程序员
任何在where子句中使用is null或is not null的语句优化器是不容许使用索引的。sql
2. 联接列数据库
对于有联接的列,即便最后的联接值为一个静态值,优化器是不会使用索引的。咱们一块儿来看一个例子,假定有一个职工表(employee),对于 一个职工的姓和名分红两列存放(FIRST_NAME和LAST_NAME),如今要查询一个叫比尔.克林顿(Bill Cliton)的职工。编程
下面是一个采用联接查询的SQL语句,小程序
select * from employss where first_name||''||last_name ='Beill Cliton';缓存
上面这条语句彻底能够查询出是否有Bill Cliton这个员工,可是这里须要注意,系统优化器对基于last_name建立的索引没有使用。安全
当采用下面这种SQL语句的编写,Oracle系统就能够采用基于last_name建立的索引。性能优化
*** where first_name ='Beill' and last_name ='Cliton';
. 3.带通配符(%)的like语句
一样以上面的例子来看这种状况。目前的需求是这样的,要求在职工表中查询名字中包含cliton的人。能够采用以下的查询SQL语句:
select * from employee where last_name like '%cliton%';
这里因为通配符(%)在搜寻词首出现,因此Oracle系统不使用last_name的索引。在不少状况下可能没法避免这种状况,可是必定要心中有底,通 配符如此使用会下降查询速度。然而当通配符出如今字符串其余位置时,优化器就能利用索引。在下面的查询中索引获得了使用:
select * from employee where last_name like 'c%';
4. Order by语句
ORDER BY语句决定了Oracle如何将返回的查询结果排序。Order by语句对要排序的列没有什么特别的限制,也能够将函数加入列中(象联接或者附加等)。任何在Order by语句的非索引项或者有计算表达式都将下降查询速度。
仔细检查order by语句以找出非索引项或者表达式,它们会下降性能。解决这个问题的办法就是重写order by语句以使用索引,也能够为所使用的列创建另一个索引,同时应绝对避免在order by子句中使用表达式。
5. NOT
咱们在查询时常常在where子句使用一些逻辑表达式,如大于、小于、等于以及不等于等等,也可使用and(与)、or(或)以及not(非)。NOT可用来对任何逻辑运算符号取反。下面是一个NOT子句的例子:
... where not (status ='VALID')
若是要使用NOT,则应在取反的短语前面加上括号,并在短语前面加上NOT运算符。NOT运算符包含在另一个逻辑运算符中,这就是不等于(<>)运算符。换句话说,即便不在查询where子句中显式地加入NOT词,NOT仍在运算符中,见下例:
... where status <>'INVALID';
对这个查询,能够改写为不使用NOT:
select * from employee where salary<3000 or salary>3000;
虽然这两种查询的结果同样,可是第二种查询方案会比第一种查询方案更快些。第二种查询容许Oracle对salary列使用索引,而第一种查询则不能使用索引。
虽然这两种查询的结果同样,可是第二种查询方案会比第一种查询方案更快些。第二种查询容许Oracle对salary列使用索引,而第一种查询则不能使用索引。
===============================================================================================
咱们要作到不但会写SQL,还要作到写出性能优良的SQL,如下为笔者学习、摘录、并汇总部分资料与你们分享!
(1) 选择最有效率的表名顺序(只在基于规则的优化器中有效):
ORACLE 的解析器按照从右到左的顺序处理FROM子句中的表名,FROM子句中写在最后的表(基础表 driving table)将被最早处理,在FROM子句中包含多个表的状况下,你必须选择记录条数最少的表做为基础表。若是有3个以上的表链接查询, 那就须要选择交叉表(intersection table)做为基础表, 交叉表是指那个被其余表所引用的表.
(2) WHERE子句中的链接顺序.:
ORACLE采用自下而上的顺序解析WHERE子句,根据这个原理,表之间的链接必须写在其余WHERE条件以前, 那些能够过滤掉最大数量记录的条件必须写在WHERE子句的末尾.
(3) SELECT子句中避免使用 ‘ * ‘:
ORACLE在解析的过程当中, 会将'*' 依次转换成全部的列名, 这个工做是经过查询数据字典完成的, 这意味着将耗费更多的时间
(4) 减小访问数据库的次数:
ORACLE在内部执行了许多工做: 解析SQL语句, 估算索引的利用率, 绑定变量 , 读数据块等;
(5) 在SQL*Plus , SQL*Forms和Pro*C中从新设置ARRAYSIZE参数, 能够增长每次数据库访问的检索数据量 ,建议值为200
(6) 使用DECODE函数来减小处理时间:
使用DECODE函数能够避免重复扫描相同记录或重复链接相同的表.
(7) 整合简单,无关联的数据库访问:
若是你有几个简单的数据库查询语句,你能够把它们整合到一个查询中(即便它们之间没有关系)
(8) 删除重复记录:
最高效的删除重复记录方法 ( 由于使用了ROWID)例子:
DELETE FROM EMP E WHERE E.ROWID > (SELECT MIN(X.ROWID)
FROM EMP X WHERE X.EMP_NO = E.EMP_NO);
(9) 用TRUNCATE替代DELETE:
当删除表中的记录时,在一般状况下, 回滚段(rollback segments ) 用来存放能够被恢复的信息. 若是你没有COMMIT事务,ORACLE会将数据恢复到删除以前的状态(准确地说是恢复到执行删除命令以前的情况) 而当运用TRUNCATE时, 回滚段再也不存听任何可被恢复的信息.当命令运行后,数据不能被恢复.所以不多的资源被调用,执行时间也会很短. (译者按: TRUNCATE只在删除全表适用,TRUNCATE是DDL不是DML)
(10) 尽可能多使用COMMIT:
只要有可能,在程序中尽可能多使用COMMIT, 这样程序的性能获得提升,需求也会由于COMMIT所释放的资源而减小: COMMIT所释放的资源:
a. 回滚段上用于恢复数据的信息.
b. 被程序语句得到的锁
c. redo log buffer 中的空间
d. ORACLE为管理上述3种资源中的内部花费
(11) 用Where子句替换HAVING子句:
避免使用HAVING子句, HAVING 只会在检索出全部记录以后才对结果集进行过滤. 这个处理须要排序,总计等操做. 若是能经过WHERE子句限制记录的数目,那就能减小这方面的开销. (非oracle中)on、where、having这三个均可以加条件的子句中,on是最早执行,where次之,having最后,由于on是先把不 符合条件的记录过滤后才进行统计,它就能够减小中间运算要处理的数据,按理说应该速度是最快的,where也应该比having快点的,由于它过滤数据后 才进行sum,在两个表联接时才用on的,因此在一个表的时候,就剩下where跟having比较了。在这单表查询统计的状况下,若是要过滤的条件没有涉及到要计算字段,那它们的结果是同样的,只是where可使用rushmore技术,而having就不能,在速度上后者要慢若是要涉及到计算的字 段,就表示在没计算以前,这个字段的值是不肯定的,根据上篇写的工做流程,where的做用时间是在计算以前就完成的,而having就是在计算后才起做 用的,因此在这种状况下,二者的结果会不一样。在多表联接查询时,on比where更早起做用。系统首先根据各个表之间的联接条件,把多个表合成一个临时表 后,再由where进行过滤,而后再计算,计算完后再由having进行过滤。因而可知,要想过滤条件起到正确的做用,首先要明白这个条件应该在何时起做用,而后再决定放在那里
(12) 减小对表的查询:
在含有子查询的SQL语句中,要特别注意减小对表的查询.例子:
SELECT TAB_NAME FROM TABLES WHERE (TAB_NAME,DB_VER) = ( SELECT
TAB_NAME,DB_VER FROM TAB_COLUMNS WHERE VERSION = 604)
(13) 经过内部函数提升SQL效率.:
复杂的SQL每每牺牲了执行效率. 可以掌握上面的运用函数解决问题的方法在实际工做中是很是有意义的
(14) 使用表的别名(Alias):
当在SQL语句中链接多个表时, 请使用表的别名并把别名前缀于每一个Column上.这样一来,就能够减小解析的时间并减小那些由Column歧义引发的语法错误.
(15) 用EXISTS替代IN、用NOT EXISTS替代NOT IN:
在许多基于基础表的查询中,为了知足一个条件,每每须要对另外一个表进行联接.在这种状况下, 使用EXISTS(或NOT EXISTS)一般将提升查询的效率. 在子查询中,NOT IN子句将执行一个内部的排序和合并. 不管在哪一种状况下,NOT IN都是最低效的 (由于它对子查询中的表执行了一个全表遍历). 为了不使用NOT IN ,咱们能够把它改写成外链接(Outer Joins)或NOT EXISTS.
例子:
(高效)SELECT * FROM EMP (基础表) WHERE EMPNO > 0 AND EXISTS (SELECT ‘X' FROM DEPT WHERE DEPT.DEPTNO = EMP.DEPTNO AND LOC = ‘MELB')
(低效)SELECT * FROM EMP (基础表) WHERE EMPNO > 0 AND DEPTNO IN(SELECT DEPTNO FROM DEPT WHERE LOC = ‘MELB')
(16) 识别'低效执行'的SQL语句:
虽然目前各类关于SQL优化的图形化工具层出不穷,可是写出本身的SQL工具来解决问题始终是一个最好的方法:
SELECT EXECUTIONS , DISK_READS, BUFFER_GETS,
ROUND((BUFFER_GETS-DISK_READS)/BUFFER_GETS,2) Hit_radio,
ROUND(DISK_READS/EXECUTIONS,2) Reads_per_run,
SQL_TEXT
FROM V$SQLAREA
WHERE EXECUTIONS>0
AND BUFFER_GETS > 0
AND (BUFFER_GETS-DISK_READS)/BUFFER_GETS < 0.8
ORDER BY 4 DESC;
(17) 用索引提升效率:
索引是表的一个概念部分,用来提升检索数据的效率,ORACLE使用了一个复杂的自平衡B-tree结构. 一般,经过索引查询数据比全表扫描要快. 当ORACLE找出执行查询和Update语句的最佳路径时, ORACLE优化器将使用索引. 一样在联结多个表时使用索引也能够提升效率. 另外一个使用索引的好处是,它提供了主键(primary key)的惟一性验证.。那些LONG或LONG RAW数据类型, 你能够索引几乎全部的列. 一般, 在大型表中使用索引特别有效. 固然,你也会发现, 在扫描小表时,使用索引一样能提升效率. 虽然使用索引能获得查询效率的提升,可是咱们也必须注意到它的代价. 索引须要空间来存储,也须要按期维护, 每当有记录在表中增减或索引列被修改时, 索引自己也会被修改. 这意味着每条记录的INSERT , DELETE , UPDATE将为此多付出4 , 5 次的磁盘I/O . 由于索引须要额外的存储空间和处理,那些没必要要的索引反而会使查询反应时间变慢.。按期的重构索引是有必要的.:
ALTER INDEX <INDEXNAME> REBUILD <TABLESPACENAME>
18) 用EXISTS替换DISTINCT:
当提交一个包含一对多表信息(好比部门表和雇员表)的查询时,避免在SELECT子句中使用DISTINCT. 通常能够考虑用EXIST替换, EXISTS 使查询更为迅速,由于RDBMS核心模块将在子查询的条件一旦知足后,马上返回结果. 例子:
(低效):
SELECT DISTINCT DEPT_NO,DEPT_NAME FROM DEPT D , EMP E
WHERE D.DEPT_NO = E.DEPT_NO
(高效):
SELECT DEPT_NO,DEPT_NAME FROM DEPT D WHERE EXISTS ( SELECT ‘X'
FROM EMP E WHERE E.DEPT_NO = D.DEPT_NO);
(19) sql语句用大写的
由于oracle老是先解析sql语句,把小写的字母转换成大写的再执行
(20) 在java代码中尽可能少用链接符“+”链接字符串!
(21) 避免在索引列上使用NOT
一般,
咱们要避免在索引列上使用NOT, NOT会产生在和在索引列上使用函数相同的影响. 当ORACLE”遇到”NOT,他就会中止使用索引转而执行全表扫描.
(22) 避免在索引列上使用计算.
WHERE子句中,若是索引列是函数的一部分.优化器将不使用索引而使用全表扫描.
举例:
低效:
SELECT … FROM DEPT WHERE SAL * 12 > 25000;
高效:
SELECT … FROM DEPT WHERE SAL > 25000/12;
(23) 用>=替代>
高效:
SELECT * FROM EMP WHERE DEPTNO >=4
低效:
SELECT * FROM EMP WHERE DEPTNO >3
二者的区别在于, 前者DBMS将直接跳到第一个DEPT等于4的记录然后者将首先定位到DEPTNO=3的记录而且向前扫描到第一个DEPT大于3的记录.
(24) 用UNION替换OR (适用于索引列)
一般状况下, 用UNION替换WHERE子句中的OR将会起到较好的效果. 对索引列使用OR将形成全表扫描. 注意, 以上规则只针对多个索引列有效. 若是有column没有被索引, 查询效率可能会由于你没有选择OR而下降. 在下面的例子中, LOC_ID 和REGION上都建有索引.
高效:
SELECT LOC_ID , LOC_DESC , REGION
FROM LOCATION
WHERE LOC_ID = 10
UNION
SELECT LOC_ID , LOC_DESC , REGION
FROM LOCATION
WHERE REGION = “MELBOURNE”
低效:
SELECT LOC_ID , LOC_DESC , REGION
FROM LOCATION
WHERE LOC_ID = 10 OR REGION = “MELBOURNE”
若是你坚持要用OR, 那就须要返回记录最少的索引列写在最前面.
(25) 用IN来替换OR
这是一条简单易记的规则,可是实际的执行效果还须检验,在ORACLE8i下,二者的执行路径彷佛是相同的.
低效:
SELECT…. FROM LOCATION WHERE LOC_ID = 10 OR LOC_ID = 20 OR LOC_ID = 30
高效
SELECT… FROM LOCATION WHERE LOC_IN IN (10,20,30);
(26) 避免在索引列上使用IS NULL和IS NOT NULL
避免在索引中使用任何能够为空的列,ORACLE将没法使用该索引.对于单列索引,若是列包含空值,索引中将不存在此记录. 对于复合索引,若是每一个列都为空,索引中一样不存在此记录. 若是至少有一个列不为空,则记录存在于索引中.举例: 若是惟一性索引创建在表的A列和B列上, 而且表中存在一条记录的A,B值为(123,null) , ORACLE将不接受下一条具备相同A,B值(123,null)的记录(插入). 然而若是全部的索引列都为空,ORACLE将认为整个键值为空而空不等于空. 所以你能够插入1000 条具备相同键值的记录,固然它们都是空! 由于空值不存在于索引列中,因此WHERE子句中对索引列进行空值比较将使ORACLE停用该索引.
低效: (索引失效)
SELECT … FROM DEPARTMENT WHERE DEPT_CODE IS NOT NULL;
高效: (索引有效)
SELECT … FROM DEPARTMENT WHERE DEPT_CODE >=0;
(27) 老是使用索引的第一个列:
若是索引是创建在多个列上, 只有在它的第一个列(leading column)被where子句引用时,优化器才会选择使用该索引. 这也是一条简单而重要的规则,当仅引用索引的第二个列时,优化器使用了全表扫描而忽略了索引
(28) 用UNION-ALL 替换UNION ( 若是有可能的话):
当SQL 语句须要UNION两个查询结果集合时,这两个结果集合会以UNION-ALL的方式被合并, 而后在输出最终结果前进行排序. 若是用UNION ALL替代UNION, 这样排序就不是必要了. 效率就会所以获得提升. 须要注意的是,UNION ALL 将重复输出两个结果集合中相同记录. 所以各位仍是要从业务需求分析使用UNION ALL的可行性. UNION 将对结果集合排序,这个操做会使用到SORT_AREA_SIZE这块内存. 对于这块内存的优化也是至关重要的. 下面的SQL能够用来查询排序的消耗量
低效:
SELECT ACCT_NUM, BALANCE_AMT
FROM DEBIT_TRANSACTIONS
WHERE TRAN_DATE = '31-DEC-95'
UNION
SELECT ACCT_NUM, BALANCE_AMT
FROM DEBIT_TRANSACTIONS
WHERE TRAN_DATE = '31-DEC-95'
高效:
SELECT ACCT_NUM, BALANCE_AMT
FROM DEBIT_TRANSACTIONS
WHERE TRAN_DATE = '31-DEC-95'
UNION ALL
SELECT ACCT_NUM, BALANCE_AMT
FROM DEBIT_TRANSACTIONS
WHERE TRAN_DATE = '31-DEC-95'
(29) 用WHERE替代ORDER BY:
ORDER BY 子句只在两种严格的条件下使用索引.
ORDER BY中全部的列必须包含在相同的索引中并保持在索引中的排列顺序.
ORDER BY中全部的列必须定义为非空.
WHERE子句使用的索引和ORDER BY子句中所使用的索引不能并列.
例如:
表DEPT包含如下列:
DEPT_CODE PK NOT NULL
DEPT_DESC NOT NULL
DEPT_TYPE NULL
低效: (索引不被使用)
SELECT DEPT_CODE FROM DEPT ORDER BY DEPT_TYPE
高效: (使用索引)
SELECT DEPT_CODE FROM DEPT WHERE DEPT_TYPE > 0
(30) 避免改变索引列的类型.:
当比较不一样数据类型的数据时, ORACLE自动对列进行简单的类型转换.
假设 EMPNO是一个数值类型的索引列.
SELECT … FROM EMP WHERE EMPNO = ‘123'
实际上,通过ORACLE类型转换, 语句转化为:
SELECT … FROM EMP WHERE EMPNO = TO_NUMBER(‘123')
幸运的是,类型转换没有发生在索引列上,索引的用途没有被改变.
如今,假设EMP_TYPE是一个字符类型的索引列.
SELECT … FROM EMP WHERE EMP_TYPE = 123
这个语句被ORACLE转换为:
SELECT … FROM EMP WHERETO_NUMBER(EMP_TYPE)=123
由于内部发生的类型转换, 这个索引将不会被用到! 为了不ORACLE对你的SQL进行隐式的类型转换, 最好把类型转换用显式表现出来. 注意当字符和数值比较时, ORACLE会优先转换数值类型到字符类型
(31) 须要小心的WHERE子句:
某些SELECT 语句中的WHERE子句不使用索引. 这里有一些例子.
在下面的例子里, (1)‘!=' 将不使用索引. 记住, 索引只能告诉你什么存在于表中, 而不能告诉你什么不存在于表中. (2) ‘ ¦ ¦'是字符链接函数. 就象其余函数那样, 停用了索引. (3) ‘+'是数学函数. 就象其余数学函数那样, 停用了索引. (4)相同的索引列不能互相比较,这将会启用全表扫描.
(32) a. 若是检索数据量超过30%的表中记录数.使用索引将没有显著的效率提升.
b. 在特定状况下, 使用索引也许会比全表扫描慢, 但这是同一个数量级上的区别. 而一般状况下,使用索引比全表扫描要块几倍乃至几千倍!
(33) 避免使用耗费资源的操做:
带有DISTINCT,UNION,MINUS,INTERSECT,ORDER BY的SQL语句会启动SQL引擎
执行耗费资源的排序(SORT)功能. DISTINCT须要一次排序操做, 而其余的至少须要执行两次排序. 一般, 带有UNION, MINUS , INTERSECT的SQL语句均可以用其余方式重写. 若是你的数据库的SORT_AREA_SIZE调配得好, 使用UNION , MINUS, INTERSECT也是能够考虑的, 毕竟它们的可读性很强
(34) 优化GROUP BY:
提升GROUP BY 语句的效率, 能够经过将不须要的记录在GROUP BY 以前过滤掉.下面两个查询返回相同结果但第二个明显就快了许多.
低效:
SELECT JOB , AVG(SAL)
FROM EMP
GROUP by JOB
HAVING JOB = ‘PRESIDENT'
OR JOB = ‘MANAGER'
高效:
SELECT JOB , AVG(SAL)
FROM EMP
WHERE JOB = ‘PRESIDENT'
OR JOB = ‘MANAGER'
GROUP by JOB
====================================
====================================
若是你正在负责一个基于SQL Server的项目,或者你刚刚接触SQL Server,你都有可能要面临一些数据库性能的问题,这篇文章会为你提供一些有用的指导(其中大多数也能够用于其它的DBMS)。
在这里,我不打算介绍使用SQL Server的窍门,也不能提供一个包治百病的方案,我所作的是总结一些经验----关于如何造成一个好的设计。这些经验来自我过去几年中经受的教训,一直来,我看到许多一样的设计错误被一次又一次的重复。
1、了解你用的工具
不要轻视这一点,这是我在这篇文章中讲述的最关键的一条。也许你也看到有不少的SQL Server程序员没有掌握所有的T-SQL命令和SQL Server提供的那些有用的工具。
“什么?我要浪费一个月的时间来学习那些我永远也不会用到的SQL命令???”,你也许会这样说。对的,你不须要这样作。可是你应该用一个周末浏览全部的 T-SQL命令。在这里,你的任务是了解,未来,当你设计一个查询时,你会记起来:“对了,这里有一个命令能够彻底实现我须要的功能”,因而,到MSDN 查看这个命令的确切语法。
2、不要使用游标
让我再重复一遍:不要使用游标。若是你想破坏整个系统的性能的话,它们却是你最有效的首选办法。大多数的初学者都使用游标,而没有意识到它们对性能形成的影响。它们占用内存,还用它们那些难以想象的方式锁定表,另外,它们简直就像蜗牛。而最糟糕的是,它们可使你的DBA所能作的一切性能优化等于没作。不 知你是否知道每执行一次FETCH就等于执行一次SELECT命令?这意味着若是你的游标有10000条记录,它将执行10000次SELECT!若是你 使用一组SELECT、UPDATE或者DELETE来完成相应的工做,那将有效率的多。
初学者通常认为使用游标是一种比较熟悉和温馨的编程方式,可很不幸,这会致使糟糕的性能。显然,SQL的整体目的是你要实现什么,而不是怎样实现。
我曾经用T-SQL重写了一个基于游标的存储过程,那个表只有100,000条记录,原来的存储过程用了40分钟才执行完毕,而新的存储过程只用了10秒钟。在这里,我想你应该能够看到一个不称职的程序员究竟在干了什么!!!
咱们能够写一个小程序来取得和处理数据而且更新数据库,这样作有时会更有效。记住:对于循环,T-SQL无能为力。
我再从新提醒一下:使用游标没有好处。除了DBA的工做外,我历来没有看到过使用游标能够有效的完成任何工做。
3、规范化你的数据表
为何不规范化数据库?大概有两个借口:出于性能的考虑和纯粹由于懒惰。至于第二点,你早晚得为此付出代价。而关于性能的问题,你不须要优化根本就不慢的东西。我常常看到一些程序员“反规范化”数据库,他们的理由是“原来的设计太慢了”,可结果却经常是他们让系统更慢了。DBMS被设计用来处理规范数据库 的,所以,记住:按照规范化的要求设计数据库。
4、不要使用SELECT *
这点不太容易作到,我太了解了,由于我本身就常常这样干。但是,若是在SELECT中指定你所须要的列,那将会带来如下的好处:
1 减小内存耗费和网络的带宽
2 你能够获得更安全的设计
3 给查询优化器机会从索引读取全部须要的列
5、了解你将要对数据进行的操做
为你的数据库建立一个健壮的索引,那但是功德一件。可要作到这一点简直就是一门艺术。每当你为一个表添加一个索引,SELECT会更快了,可INSERT 和DELETE却大大的变慢了,由于建立了维护索引须要许多额外的工做。显然,这里问题的关键是:你要对这张表进行什么样的操做。这个问题不太好把握,特别是涉及DELETE和UPDATE时,由于这些语句常常在WHERE部分包含SELECT命令。
6、不要给“性别”列建立索引
首先,咱们必须了解索引是如何加速对表的访问的。你能够将索引理解为基于必定的标准上对表进行划分的一种方式。若是你给相似于“性别”这样的列建立了一个 索引,你仅仅是将表划分为两部分:男和女。你在处理一个有1,000,000条记录的表,这样的划分有什么意义?记住:维护索引是比较费时的。当你设计索 引时,请遵循这样的规则:根据列可能包含不一样内容的数目从多到少排列,好比:姓名+省份+性别。
7、使用事务
请使用事务,特别是当查询比较耗时。若是系统出现问题,这样作会救你一命的。通常有些经验的程序员都有体会-----你常常会碰到一些不可预料的状况会致使存储过程崩溃。
8、当心死锁
按照必定的次序来访问你的表。若是你先锁住表A,再锁住表B,那么在全部的存储过程当中都要按照这个顺序来锁定它们。若是你(不经意的)某个存储过程当中先锁定表B,再锁定表A,这可能就会致使一个死锁。若是锁定顺序没有被预先详细的设计好,死锁是不太容易被发现的。
9、不要打开大的数据集
一个常常被提出的问题是:我怎样才能迅速的将100000条记录添加到ComboBox中?这是不对的,你不能也不须要这样作。很简单,你的用户要浏览 100000条记录才能找到须要的记录,他必定会诅咒你的。在这里,你须要的是一个更好的UI,你须要为你的用户显示不超过100或200条记录。
10、不要使用服务器端游标
与服务器端游标比起来,客户端游标能够减小服务器和网络的系统开销,而且还减小锁定时间。
11、使用参数查询
有时,我在CSDN技术论坛看到相似这样的问题:“SELECT * FROM a WHERE a.id='A'B,由于单引号查询发生异常,我该怎么办?”,而广泛的回答是:用两个单引号代替单引号。这是错误的。这样治标不治本,由于你还会在其余 一些字符上遇到这样的问题,更况且这样会致使严重的bug,除此之外,这样作还会使SQL Server的缓冲系统没法发挥应有的做用。使用参数查询,釜底抽薪,这些问题通通不存在了。
12、在程序编码时使用大数据量的数据库
程序员在开发中使用的测试数据库通常数据量都不大,可常常的是最终用户的数据量都很大。咱们一般的作法是不对的,缘由很简单:如今硬盘不是很贵,可为何性能问题却要等到已经无可挽回的时候才被注意呢?
十3、不要使用INSERT导入大批的数据
请不要这样作,除非那是必须的。使用UTS或者BCP,这样你能够一举而兼得灵活性和速度。
十4、注意超时问题
查询数据库时,通常数据库的缺省都比较小,好比15秒或者30秒。而有些查询运行时间要比这长,特别是当数据库的数据量不断变大时。
十5、不要忽略同时修改同一记录的问题
有时候,两个用户会同时修改同一记录,这样,后一个修改者修改了前一个修改者的操做,某些更新就会丢失。处理这种状况不是很难:建立一个timestamp字段,在写入前检查它,若是容许,就合并修改,若是存在冲突,提示用户。
十6、在细节表中插入纪录时,不要在主表执行SELECT MAX(ID)
这是一个广泛的错误,当两个用户在同一时间插入数据时,这会致使错误。你可使用SCOPE_IDENTITY,IDENT_CURRENT和IDENTITY。若是可能,不要使用IDENTITY,由于在有触发器的状况下,它会引发一些问题(详见这里的讨论)。
十7、避免将列设为NULLable
若是可能的话,你应该避免将列设为NULLable。系统会为NULLable列的每一行分配一个额外的字节,查询时会带来更多的系统开销。另外,将列设为NULLable使编码变得复杂,由于每一次访问这些列时都必须先进行检查。
我并非说NULLS是麻烦的根源,尽管有些人这样认为。我认为若是你的业务规则中容许“空数据”,那么,将列设为NULLable有时会发挥很好的做用,可是,若是在相似下面的状况中使用NULLable,那简直就是自讨苦吃。
CustomerName1
CustomerAddress1
CustomerEmail1
CustomerName2
CustomerAddress2
CustomerEmail3
CustomerName1
CustomerAddress2
CustomerEmail3
若是出现这种状况,你须要规范化你的表了。
十8、尽可能不要使用TEXT数据类型
除非你使用TEXT处理一个很大的数据,不然不要使用它。由于它不易于查询,速度慢,用的很差还会浪费大量的空间。通常的,VARCHAR能够更好的处理你的数据。
十9、尽可能不要使用临时表
尽可能不要使用临时表,除非你必须这样作。通常使用子查询能够代替临时表。使用临时表会带来系统开销,若是你是用COM+进行编程,它还会给你带来很大的麻 烦,由于COM+使用数据库链接池而临时表却自始至终都存在。SQL Server提供了一些替代方案,好比Table数据类型。
二10、学会分析查询
SQL Server查询分析器是你的好伙伴,经过它你能够了解查询和索引是如何影响性能的。
二11、使用参照完整性
定义主健、惟一性约束和外键,这样作能够节约大量的时间。
================================================================================================
【IT168 技术文档】任何事情都有它的源头,要解决问题,也得从源头开始,影响ORACLE性能的源头很是多,主要包括以下方面:数据库的硬件配置:CPU、内存、网络条件。
1. CPU:在任何机器中CPU的数据处理能力每每是衡量计算机性能的一个标志,而且ORACLE是一个提供并行能力的数据库系统,在CPU方面的要求就更高 了,若是运行队列数目超过了CPU处理的数目,性能就会降低,咱们要解决的问题就是要适当增长CPU的数量了,固然咱们还能够将须要许多资源的进程 KILL掉;
2. 内存:衡量机器性能的另一个指标就是内存的多少了,在ORACLE中内存和咱们在建数据库中的交换区进行数据的交换,读数据时,磁盘I/O必须等待物理 I/O操做完成,在出现ORACLE的内存瓶颈时,咱们第一个要考虑的是增长内存,因为I/O的响应时间是影响ORACLE性能的主要参数,我将在这方面 进行详细的讲解
3. 网络条件:NET*SQL负责数据在网络上的来往,大量的SQL会令网络速度变慢。好比10M的网卡和100的网卡就对NET*SQL有很是明显的影响, 还有交换机、集线器等等网络设备的性能对网络的影响很明显,建议在任何网络中不要试图用3个集线器来将网段互联。
OS参数的设置
下表给出了OS的参数设置及说明,DBA能够根据实际须要对这些参数进行设置
内核参数名
说明
bufpages
对buffer空间不按静态分配,采用动态分配,使bufpages值随nbuf一块儿对buffer空间进行动态分配。
create_fastlinks
对HFS文件系统容许快速符号连接
dbc_max_pct
加大最大动态buffer空间所占物理内存的百分比,以知足应用系统的读写命中率的须要。
dbc_min_pct
设置最小动态buffer空间所占物理内存的百分比
desfree
提升开始交换操做的最低空闲内存下限,保障系统的稳定性,防止出现不可预见的系统崩溃(Crash)。
fs_async
容许进行磁盘异步操做,提升CPU和磁盘的利用率
lotsfree
提升系统解除换页操做的空闲内存的上限值,保证应用程序有足够的可用内存空间。
maxdsiz
针对系统数据量大的特色,加大最大数据段的大小,保证应用的须要。(32位)
maxdsiz_64bit
maximum process data segment size for 64_bit
Maxssiz
加大最大堆栈段的大小。(32_bit)
maxssiz_64bit
加大最大堆栈段的大小。(64_bit)
Maxtsiz
提升最大代码段大小,知足应用要求
maxtsiz_64bit
原值过大,应调小
Minfree
提升中止交换操做的自由内存的上限
Shmem
容许进行内存共享,以提升内存的利用率
Shmmax
设置最大共享内存段的大小,彻底知足目前的须要
Timeslice
因为系统的瓶颈主要反映在磁盘I/O上,所以 下降时间片的大小,一方面可避免因磁盘I/O不顺畅形成CPU的等待,从而提升了CPU的综合利用率。另外一方面减小了进程的阻塞量。
unlockable_mem
提升了不可锁内存的大小,使可用于换页和交换的内存空间扩大,用以知足系统对内存管理的要求。
用户SQL质量
以上讲的都是硬件方面的东西,在条件有限的条件下,咱们能够调整应用程序的SQL质量:
1. 不要进行全表扫描(Full Table Scan):全表扫描致使大量的I/O
2. 尽可能建好和使用好索引:建索引也是有讲究的,在建索引时,也不是索引越多越好,当一个表的索引达到4个以上时,ORACLE的性能可能仍是改善不了,由于 OLTP系统每表超过5个索引即会下降性能,并且在一个sql 中, Oracle 从不能使用超过 5个索引;当咱们用到GROUP BY和ORDER BY时,ORACLE就会自动对数据进行排序,而ORACLE在INIT.ORA中决定了sort_area_size区的大小,当排序不能在咱们给定的 排序区完成时,ORACLE就会在磁盘中进行排序,也就是咱们讲的临时表空间中排序, 过多的磁盘排序将会令 free buffer waits 的值变高,而这个区间并不仅是用于排序的,对于开发人员我提出以下忠告:
1)、select,update,delete 语句中的子查询应当有规律地查找少于20%的表行.若是一个语句查找的行数超过总行数的20%,它将不能经过使用索引得到性能上的提升.
2)、索引可能产生碎片,由于记录从表中删除时,相应也从表的索引中删除.表释放的空间能够再用,而索引释放的空间却不能再用.频繁进行删除操 做的被索引的表,应当阶段性地重建索引,以免在索引中形成空间碎片,影响性能.在许可的条件下,也能够阶段性地truncate表,truncate命 令删除表中全部记录,也删除索引碎片.
3)、在使用索引时必定要按索引对应字段的顺序进行引用。
4)、用(+)比用NOT IN更有效率。
下降ORACLE的竞争:
先讲几个ORACLE的几个参数,这几个参数关系到ORACLE的竞争:
1)、freelists 和 freelist 组:他们负责ORACLE的处理表和索引的空间管理;
2)、pctfree 及 pctused:该参数决定了freelists 和 freelist 组的行为,pctfree 和pctused 参数的惟一目的就是为了控制块如何在 freelists 中进出
设置好pctfree 及 pctused对块在freelists的移走和读取很重要。
其余参数的设置
1)、包括SGA区(系统全局区):系统全局区(SGA)是一个分配给Oracle 的包含一个 Oracle 实例的数据库的控制信息内存段。
主要包括数据库高速缓存(the database buffer cache),
重演日志缓存(the redo log buffer),
共享池(the shared pool),
数据字典缓存(the data dictionary cache)以及其它各方面的信息
2)、db_block_buffers(数据高速缓冲区)访问过的数据都放在这一片内存区域,该参数越大,Oracle在内存中找到相同数据的可能性就越大,也即加快了查询速度。
3)、share_pool_size (SQL共享缓冲池):该参数是库高速缓存和数据字典的高速缓存。
4)、Log_buffer (重演日志缓冲区)
5)、sort_area_size(排序区)
6)、processes (同时链接的进程数)
7)、db_block_size (数据库块大小):Oracle默认块为2KB,过小了,由于若是咱们有一个8KB的数据,则2KB块的数据库要读4次盘,才能读完,而8KB块的数据库 只要1次就读完了,大大减小了I/O操做。数据库安装完成后,就不能再改变db_block_size的值了,只能从新创建数据库而且建库时,要选择手工 安装数据库。
8)、open_links (同时打开的连接数)
9)、dml_locks
10)、open_cursors (打开光标数)
11)、dbwr_io_slaves (后台写进程数)
6. IN和EXISTS
有时候会将一列和一系列值相比较。最简单的办法就是在where子句中使用子查询。在where子句中可使用两种格式的子查询。
第一种格式是使用IN操做符:
... where column in(select * from ... where ...);
第二种格式是使用EXIST操做符:
... where exists (select 'X' from ...where ...);
本文引用自http://www.cnblogs.com/ziyiFly/archive/2008/12/24/1361380.html。