Application application_1512618719369_147804 failed 2 times due to ApplicationMaster for attempt app

今天遇到一个特别怪的问题,以前etl中的hive任务一直报错,持续一上午,也没有查出缘由,错误的任务的日志也找到,本来能够找到缘由,可是打开日志,内心面一凉,什么报错也没有,不知所错。最后观察报错的节点,最终集中到两台机器,那就看看是否是这两台机器的hadoop的程序引发的吗?看看他们的程序都在,可是查看nodemanager的日志一直报错,而且查看cpu,nodemanager进程占用的cpu达1000%多,立刻眼前一亮,知道cpu占用太多,致使ap不能联系,致使任务失败,最后把这两台机器的nodemanager重启一下,观察了一下,任务不在报错。继续努力.............node

相关文章
相关标签/搜索