最近项目中的数据库查询常常挂起,应用程序启动后也报操做超时。测试人员就说数据库又挂了(貌似他们眼中的链接失败,查询无果都是挂了),经过 show processlist 一看,满屏都是 Waiting for table metadata lock 状态的链接。第一反应就是kill掉这些链接,奈何链接实在太多,实在kill不过来,因而重启服务,貌似重启果然能解决90%的问题,但若是不找到问题缘由,问题也确定会再次出现。html
在网上查询得知MySQL在进行一些alter table等DDL操做时,若是该表上有未提交的事务则会出现 Waiting for table metadata lock ,而一旦出现metadata lock,该表上的后续操做都会被阻塞(详见 http://www.bubuko.com/infodetail-1151112.html)。因此这个问题需从两方面解决:mysql
select trx_state, trx_started, trx_mysql_thread_id, trx_query from information_schema.innodb_trx\G
(\G做为结束符时,MySQL Client会把结果以列模式展现,对于列比较长的表,展现更直观)sql
字段意义:shell
trx_state: 事务状态,通常为RUNNING
trx_started: 事务执行的起始时间,若时间较长,则要分析该事务是否合理
trx_mysql_thread_id: MySQL的线程ID,用于kill
trx_query: 事务中的sql
通常只要kill掉这些线程,DDL操做就不会Waiting for table metadata lock。数据库
set session lock_wait_timeout = 1800; set global lock_wait_timeout = 1800;
好让出现该问题时快速故障(failfast)bash
kill掉第一个锁表的进程, 依然没有改善. 既然不改善, 我们就想办法将全部锁表的进程kill掉吧, 简单的脚本以下.session
#!/bin/bash mysql -u root -e "show processlist" | grep -i "Locked" >> locked_log.txt for line in `cat locked_log.txt | awk '{print $1}'` do echo "kill $line;" >> kill_thread_id.sql done
如今kill_thread_id.sql的内容像这个样子ide
kill 66402982; kill 66402983; kill 66402986; kill 66402991; .....
好了, 咱们在mysql的shell中执行, 就能够把全部锁表的进程杀死了.测试
mysql>source kill_thread_id.sql线程
固然了, 也能够一行搞定
for id in `mysqladmin processlist | grep -i locked | awk '{print $1}'` do mysqladmin kill ${id} done