今天在测试机上tmp目录下删除了几个文件,而后发现datanode上jps无进程显示,而namenode上有,因而比较二者发现datanode上的/tmp/hsperfdata_root 被误删了,没办法只能重启集群。看来对于集群的实际运用还有很长一段路要走啊。java
知其然也要知其因此然。node
特此从其余地方摘录了jps相关的信息作个记录。linux
原文连接:http://trinea.iteye.com/blog/1196400ubuntu
一、jps的做用windows
jps相似linux的ps命令,不一样的是ps是用来显示进程,而jps只显示java进程,准确的说是当前用户已启动的部分java进程信息,信息包括进程号和简短的进程command。jvm
二、某个java进程已经启动,用jps却显示不了该进程进程号工具
这个问题已经碰到过两次了,因此在这里总结下。测试
现象:pwa
用ps -ef|grep java能看到启动的java进程,可是用jps查看却不存在该进程的id。待会儿解释过以后就能知道在该状况下,jconsole、jvisualvm可能没法监控该进程,其余java自带工具也可能没法使用blog
分析:
java程序启动后,默认(请注意是默认)会在/tmp/hsperfdata_userName目录下以该进程的id为文件名新建文件,并在该文件中存储jvm运行的相关信息,其中的userName为当前的用户名,/tmp/hsperfdata_userName目录会存放该用户全部已经启动的java进程信息。对于windows机器/tmp用Windows存放临时文件目录代替。
而jps、jconsole、jvisualvm等工具的数据来源就是这个文件(/tmp/hsperfdata_userName/pid)。因此当该文件不存在或是没法读取时就会出现jps没法查看该进程号,jconsole没法监控等问题
缘由:
(1)、磁盘读写、目录权限问题
若该用户没有权限写/tmp目录或是磁盘已满,则没法建立/tmp/hsperfdata_userName/pid文件。或该文件已经生成,但用户没有读权限
(2)、临时文件丢失,被删除或是按期清理
对于linux机器,通常都会存在定时任务对临时文件夹进行清理,致使/tmp目录被清空。这也是我第一次碰到该现象的缘由。经常使用的可能定时删除临时目录的工具为crontab、redhat的tmpwatch、ubuntu的tmpreaper等等
这个致使的现象可能会是这样,用jconsole监控进程,发如今某一时段后进程仍然存在,可是却没有监控信息了。
(3)、java进程信息文件存储地址被设置,不在/tmp目录下
上面咱们在介绍时说默认会在/tmp/hsperfdata_userName目录保存进程信息,但因为以上一、2所述缘由,可能致使该文件没法生成或是丢失,因此java启动时提供了参数(-Djava.io.tmpdir),能够对这个文件的位置进行设置,而jps、jconsole都只会从/tmp目录读取,而没法从设置后的目录读物信息,这是我第二次碰到该现象的缘由
关于设置该文件位置的参数为-Djava.io.tmpdir
其余:
/tmp/hsperfdata_userName/pid文件会在对应java进程退出后被清除。若是java进程非正常退出(如kill -9),那么pid文件会被保留,直到执行一次java命令或是加载了jvm程序的命令(如jps、javac、jstat),会将全部无用的pid文件都清除掉