db2死锁分析与处理

  在数据库中,锁的主要功能是为了控制并发数据的完整性而引入的机制,在并发应用中出现锁现象并不可怕,锁现象一般分为死锁和锁等待两种情形。   html

死锁是由于两个并发的进程或者线程同时各自占有一个资源,又须要占有对方资源,但又都各不相让形成的,这一般是由于程序在并发上考虑不周形成的。java

锁等待则是数据库中最普通的状况,一各应用使用数据期间必然要加锁,防止其余进程或应用破坏数据,其余进程或应用在此期间不得不等待前一个应用释放锁。锁等待时间参数是可调的,但要视实际应用状况而定,好比在网络环境中,复杂应用环境,或者对实时性要求不高的环境中,能够将锁等待时间调大一些,有些状况要调小一些。锁等待不一样于死锁,死锁属于程序并发不当,须要调整程序并发机制,锁等待则属于性能问题,可能须要调整程序的sql语句。sql

不论是DB2死锁仍是锁等待,数据库都有相应参数可调,也有相应的工具能够捕获和分析,如下是锁处理的一般办法。数据库

1.查看和更改与锁相关的主要配置参数网络

$db2 get db cfg并发

在参数列表中寻找DLCHKTIME和LOCKTIMEOUT两个参数。(grep -i "LOCKTIMEOUT")app

-DLCHKTIME 单位是毫秒,是DB2死锁的间隔时间,假设该值为10000ms,则意味着每隔10秒钟检查一下当前数据库中有无死锁存在,若有死锁,会选择回滚其中的某一个事务,让另一个事务完成交易。ide

-LOCKTIMEOUT单位是秒,是锁等待最长时间,超过该时间仍未得到锁,则返回错误。函数

设置提示:工具

-缺省状况下,LOCKTIMEOUT是-1,意味着锁等待时间无限期,这和实际应用需求通常是不太相符的,须要将其值设为大于0的一个数。能够将 LOCKTIMEOUT 设置为很短的时间值,例如 10 或 15 秒。在锁上等待过长时间会在锁上产生雪崩效应。

首先,用如下命令检查 LOCKTIMEOUT 的值:

db2 "get db cfg for DBNAME"

并查找包含如下文本的行:

Lock timeout (sec) (LOCKTIMEOUT) = -1

若是值是 -1,考虑使用如下命令将它更改成 15 秒(必定要首先询问应用程序开发者或供应商以确保应用程序可以处理锁超时):

db2 "update db cfg for DBNAME using LOCKTIMEOUT 15"

-DLCHKTIME时间一般要设得比LOCKTIMEOUT时间小一些,不然未等发现死锁,就会被以锁等待超时而返回错误。


2.查看当前并发应用

CLP方式:

db2 list applications

或db2 list applications show detail

或 db2 list applications for database dbname [ show detail]

该命令能够查看当前是否有多个应用在链接着数据库,从而排查是否有并发的存在。

注意Application Name 和Application Id两栏,Application Name栏列出了应用的名字,db2bp一般意味着目前有CLP在链接数据库,java则意味着可能有db2cc或用户本身的java应用在链接数据库,在application Id栏中能够看到这些应用来自于哪些机器,本机的就显示为 LOCAL + 用户名 + 开始链接上的时间,远程的就会显示为16进制的IP地址+用户名+开始链接上的时间。经过排查并发应用从而消除测试中没必要要的锁现象。

3.查看和更改快照参数


若是在合理设置了DLCHKTIME和LOCKTIMEOUT参数仍然出现锁现象,能够查看快照或者建立事件监控器来分析缘由。要采用快照,首先要打开快照开关


 
 
  1. db2 get monitor switches

输出中将包含如下参数:

监控开关 数据库管理器参数 注释

BUFFERPOOL DFT_MON_BUFPOOL 缓冲区的读写状况和发生时间

LOCK DFT_MON_LOCK 锁持有,锁等待,以及DB2死锁的发生状况

SORT DFT_MON_SORT Heap的使用状况,排序性能

STATEMENT DFT_MON_STMT 语句起始时间,语句内容


 
 
  1. TABLE DFT_MON_TABLE Measure of activity (rows read/written)  

  2. UOW DFT_MON_UOW Start/end times, completion status  

  3. TIMESTAMP DFT_MON_TIMESTAMP Timestamps  


为了观察快照中的锁和执行语句状况,通常把LOCK和STATEMENT选项设为ON,也能够酌情把其余开关打开,示例以下: db2 update monitor switches using lock on statement on


4.查看快照信息


-查看数据库管理器级别快照信息


 
 
  1. db2 get snapshot for dbm

-查看数据库级别快照信息


 
 
  1. db2 get snapshot for database on dbname

-查看应用级别快照信息


 
 
  1. db2 get snapshot for application agentid appl-handler

注:appl-handler能够从list applicaitions的输出中获得

-查看表级别快照信息


 
 
  1. db2 get snapshot for tables on dbname

注:须要把tables快照开关设为ON才会有做用

-查看锁快照信息


 
 
  1. db2 get snapshot for locks on dbname


 
 
  1. db2 get snapshot for locks on for application agentid appl-handler

-查看动态sql语句快照信息


 
 
  1. db2 get snapshot for dynamic sql on dbname

5.使用事件查看器


可使用时间查看器收集锁事件,SQL语句事件,从而根据事件分析锁缘由。

事件类型


使用事件监控器,首先要选定所关注的事件类型,DB2中有不少事件类型,能够用于锁分析的一般会用到如下三种:


 
 
  1. DEADLOCKS  

  2. DEADLOCKS WITH DETAILS  

  3. STATEMENTS  


步骤:


-建立事件监控器


 
 
  1. create event monitor evmname for eventtype write to file ‘directory’

例:create event monitor mymonitor for deadlocks, statements


 
 
  1. write to file ‘c:\temp’

-把事件监控器打开


接上例:


 
 
  1. set event monitor mymonitor state 1

注:1为打开,0为关闭

事件监控器开始工做,当全部应用断掉链接后,将事件记录下来

-查看事件细节


 
 
  1. db2evmon –path ‘c:\temp’

上述的相关内容就是对DB2死锁和锁等待两种情形的描述,但愿会给你带来一些帮助在此方面。



补充:锁的简单处理

$ db2 connect to portaldb


  Database Connection Information


Database server        = DB2/LINUXX8664 9.7.6

SQL authorization ID   = DB2INST1

Local database alias   = PORTALDB


$db2 get snapshot for locks on portaldb|grep -i "Application handle"

Application handle                         = 46046

Application handle                         = 46013

Application handle                         = 45934

Application handle                         = 45776

Application handle                         = 26

Application handle                         = 45664

Application handle                         = 45598


强行终止锁


$db2 force application'('45598')'

$db2 "force application(45598)"


监控运行时间长排序次数多读最多运行频率高的SQL

   要想查看这些SQL,能够经过表函数(DB2 V8)或系统管理视图(DB2 V9)来实现。

   在DB2 V9中增长了管理视图,能够以下使用:

查看执行时间最长的 5 个动态 SQL 语句:

 
  
select AVERAGE_EXECUTION_TIME_S , SUBSTR(STMT_TEXT, 1 , 200 ) AS STMT_TEXT from SYSIBMADM.
TOP_DYNAMIC_SQL order by AVERAGE_EXECUTION_TIME_S desc fetch first 5 rows only ;

查看执行频率最高的 5 个动态 SQL 语句:

 
  
select NUM_EXECUTIONS, AVERAGE_EXECUTION_TIME_S, STMT_SORTS, SORTS_PER_EXECUTION,
SUBSTR(STMT_TEXT, 1 , 200 ) AS STMT_TEXT from SYSIBMADM.
TOP_DYNAMIC_SQL ORDER BY NUM_EXECUTIONS desc fetch first 5 rows only ;

查看排序次数最多的 5 个动态 SQL 语句:

 
  
select STMT_SORTS, SORTS_PER_EXECUTION, substr(STMT_TEXT, 1 , 200 ) as STMT_TEXT from SYSIBMADM.
TOP_DYNAMIC_SQL order by STMT_SORTS desc fetch first 5 rows only ;

   在DB2 V8中增长了表函数,能够以下使用:

查看执行时间最长的 5 个动态 SQL 语句:

 
  
select TOTAL_EXEC_TIME / NUM_EXECUTIONS, SUBSTR(STMT_TEXT, 1 , 200 )
AS STMT_TEXT FROM TABLE ( SNAPSHOT_DYN_SQL ( CAST ( NULL AS VARCHAR ( 1 )), CAST ( NULL AS INTEGER )))
as SNAPSHOT_DYN_SQL order by TOTAL_EXEC_TIME / NUM_EXECUTIONS desc fetch first 5 rows only ;

查看执行频率最高的 5 个动态 SQL 语句:

 
  
select NUM_EXECUTIONS, TOTAL_EXEC_TIME / NUM_EXECUTIONS, STMT_SORTS,
STMT_SORTS / NUM_EXECUTIONS as SORTS_PER_EXECUTION,
SUBSTR(STMT_TEXT, 1 , 200 ) AS STMT_TEXT from TABLE ( SNAPSHOT_DYN_SQL ( CAST ( NULL AS VARCHAR ( 1 )),
CAST ( NULL AS INTEGER ))) as SNAPSHOT_DYN_SQL ORDER BY NUM_EXECUTIONS desc fetch first 5 rows only ;;

查看排序次数最多的 5 个动态 SQL 语句:

 
  
select STMT_SORTS, STMT_SORTS / NUM_EXECUTIONS as SORTS_PER_EXECUTION,
substr(STMT_TEXT, 1 , 200 ) as STMT_TEXT from TABLE ( SNAPSHOT_DYN_SQL ( CAST ( NULL AS VARCHAR ( 1 )),
CAST ( NULL AS INTEGER ))) as SNAPSHOT_DYN_SQL order by STMT_SORTS desc fetch first 5 rows only ;

   若是发现了运行成本比较高的SQL,就要来优化这些SQL的执行效率,来下降持有锁的锁产生的资源消耗,进一步下降死锁和锁等待的产生。


注意:死锁是无法保证100%避免的,但能够作到尽可能避免,在必定程度上减小死锁。死锁的频繁发生主要须要从应用角度入手,好比选择合适的隔离级别,是否对表采用乐观锁,以及将对于同一张表的操做放到不一样的时间上执行等方法。

相关文章
相关标签/搜索