Application application_1512618719369_147804 failed 2 times due to ApplicationMaster for attempt app

时间 2019-11-24

标签 application failed times applicationmaster attempt app 繁體版

原文原文链接

今天遇到一个特别怪的问题，以前etl中的hive任务一直报错，持续一上午，也没有查出缘由，错误的任务的日志也找到，本来能够找到缘由，可是打开日志，内心面一凉，什么报错也没有，不知所错。最后观察报错的节点，最终集中到两台机器，那就看看是否是这两台机器的hadoop的程序引发的吗？看看他们的程序都在，可是查看nodemanager的日志一直报错，而且查看cpu，nodemanager进程占用的cpu达1000%多，立刻眼前一亮，知道cpu占用太多，致使ap不能联系，致使任务失败，最后把这两台机器的nodemanager重启一下，观察了一下，任务不在报错。继续努力.............node