Hadoop全链路监控方案

做为一名大数据运维工程师,你手下管理着批量的集群机器,而且同时这个集群的规模还会不定时的扩大,机器一旦变多,发生问题的频率和类型就会变多,因此这时,你靠人肉去分析某台机器上的日志,OK,1台机器,2台机器,尚且能够解决办法,可是100台,1000台呢,固然若是工程师还这么作的话,我想他会抓狂的.因此如何作到智能化发现问题,定位问题,就显得很关键了,最理想的结果是,你拥有你的集群机器中天天跑的job
相关文章
相关标签/搜索