Atitit.线程 死锁 跑飞 的检测与自动解除 与手动解除死锁 java c# .net php javascript. javascript
1. 现象::主程序卡住无反应,多行任务不往下执行 1php
2. 缘由::使用jv jprofile查看线程,原来俩个线程死锁了。。 1java
4. 自动检测与解除死锁::使用看门狗watchdog 2数据库
程序的跑飞,而陷入死循环,程序的正常运行被打断, 系统没法继续工做,会形成整个系统的陷入停滞状态,
不像数据库,许多数据库均可以自动解除死锁,而后安排事务重作。。
Java的语言级别无此功能,只能本身在类库级别实现次功能了。。
做者:: 老哇的爪子 Attilax 艾龙, EMAIL:1466519819@qq.com
转载请注明来源: http://blog.csdn.net/attilax
死锁检测与恢复是指系统设有专门的机构,当死锁发生时,该机构可以检测到死锁发生的位置和缘由,并能经过外力破坏死锁发生的必要条件,从而使得并发进程从死锁状态中恢复出来。
专门用于监测程序运行状态的芯片
Linux 自带了一个 watchdog 的实现,用于监视系统的运行,包括一个内核 watchdog module 和一个用户空间的 watchdog 程序。[1]
内核 watchdog 模块经过 /dev/watchdog 这个字符设备与用户空间通讯。用户空间程序一旦打开 /dev/watchdog 设备,就会致使在内核中启动一个 1分钟的定时器,此后,用户空间程序须要保证在 1分钟以内向这个设备写入数据,每次写操做会致使从新设定定时器。若是用户空间程序在 1分钟以内没有写操做,定时器到期会致使一次系统 reboot 操做。[1]
看门狗,又叫 watchdog timer,是一个定时器电路, 通常有一个输入,叫喂狗, 正常工做的时候,每隔一段时间输出一个信号到喂狗端,给 WDT 清零,若是超过规定时间不喂狗(通常在程序跑飞时),WDT 定时超过,就会给出一个复位信号到 复位. 防止 死机. 看门狗的做用就是防止程序发生死循环或者说程序跑飞。
(1)最简单,最经常使用的方法就是进行系统的从新启动,不过这种方法代价很大,它意味着在这以前全部的进程已经完成的计算工做都将付之东流,包括参与死锁的那些进程,以及未参与死锁的进程。
终止参与死锁的进程,收回它们占有的资源,从而解除死锁。这时又分两种状况:一次性撤消参与死锁的所有进程,剥夺所有资源;或者逐步撤消参与死锁的进程,逐步收回死锁进程占有的资源。通常来讲,选择逐步撤消的进程时要按照必定的原则进行,目的是撤消那些代价最小的进程,好比按进程的优先级肯定进程的代价;考虑进程运行时的代价和与此进程相关的外部做业的代价等因素。
即让参与死锁的进程回退到没有发生死锁前某一点处,并由此点处继续执行,以求再次执行时再也不发生死锁。虽然这是个较理想的办法,可是操做起来系统开销极大,要有堆栈这样的机构记录进程的每一步变化,以便从此的回退,有时这是没法作到的。
进程回退策略,即让参与死锁的进程回退到没有发生死锁前某一点处,并由此点处继续执行,以求再次执行时再也不发生死锁。虽然这是个较理想的办法,可是操做起来系统开销极大,要有堆栈这样的机构记录进程的每一步变化,以便从此的回退,有时这是没法作到的
包装系统thread ,每当启动线程的时候儿,向线程注册表格插入线程..退出的时候儿clr...
要是死锁兰,马clr,能查询,在手动clr...
看门狗的应用,使系统能够在无人状态下实现连续工做,其工做原理是:看门狗芯片和系统的一个I/O引脚相连(纯软件中经过一个变量相连),该I/O引脚经过程序控制它定时地往看门狗的这个引脚上送入高电平(或低电平,软件中是送入一个变量值),这一程序语句是分散地放在系统其余控制语句中间的,一旦系统因为干扰形成程序跑飞后而陷入某一程序段进入死循环状态时,写看门狗引脚的程序便不能被执行,这个时候,看门狗电路就会因为得不到系统送来的信号,便在它和系统复位引脚相连的引脚上送出一个复位信号,使系统发生复位,即程序从程序存储器的起始位置开始执行,这样便实现了系统的自动复位.
在系统运行之后也就启动了看门狗的计数器,看门狗就开始自动计数,若是到了必定的时间还不去清看门狗,那么看门狗计数器就会溢出从而引发看门狗中断,形成系统复位。因此在使用有看门狗的芯片时要注意清看门狗。
硬件看门狗是利用了一个定时器,来监控主程序的运行,也就是说在主程序的运行过程当中,咱们要在定时时间到以前对定时器进行复位若是出现死循环,或者说PC指针不能回来。那么定时时间到后就会使系统复位
软件看门狗技术的原理和这差很少,只不过是用软件的方法实现,咱们仍是以51系列来说,咱们知道在51系统中有两个定时器,咱们就能够用这两个定时器来对主程序的运行进行监控。咱们能够对T0设定必定的定时时间,当产生定时中断的时候对一个变量进行赋值,而这个变量在主程序运行的开始已经有了一个初值,在这里咱们要设定的定时值要小于主程序的运行时间,这样在主程序的尾部对变量的值进行判断,若是值发生了预期的变化,就说明T0中断正常,若是没有发生变化则使程序复位。对于T1咱们用来监控主程序的运行,咱们给T1设定必定的定时时间,在主程序中对其进行复位,若是不能在必定的时间里对其进行复位,T1 的定时中断就会使系统复位。在这里T1的定时时间要设的大于主程序的运行时间,给主程序留有必定的的裕量。而T1的中断正常与否咱们再由T0定时中断子程序来监视。这样就构成了一个循环,T0监视T1,T1监视主程序,主程序又来监视T0,从而保证系统的稳定运行。
系统软件"看门狗"的设计思路:
1.看门狗定时器T0的设置。在初始化程序块中设置T0的工做方式,并开启中断(timer事件)和计数功能。
2.计算主控程序循环一次的耗时。考虑系统各功能模块及其循环次数,本系统主控制程序的运行时间约为30。系统设置"看门狗"定时器T0定时60s
3.主控程序的每次循环都将刷新T0的初值。如程序进入"死循环"而T0的初值在60s内未被刷新,这时"看门狗"定时器T0将溢出并申请中断。
3.设计T0溢出所对应的中断服务程序。此子程序只须一条指令,即在T0对应的中断向量地址(000BH)(JAVA中是一个线程的引用),写入复位,对任务从新进行初始化并得到正确的执行顺序
参考Java出现死锁了? - 推酷.htm
atitit 提高数据库死锁处理总结 - attilax的专栏 - 博客频道 - CSDN.NET.htm
watchdog_百度百科.htm
java 死锁产生缘由及解锁 - hijiankang的专栏 - 博客频道 - CSDN.NET.htm