2016年2月五、6日:调研应用监控系统

这两每天气还不错,有风,空气好git

(其实以前也一直写工做日志,只是多数和公司产品直接相关,就不便公开了)github

这两天花了不少时间研究应用监控解决方案。这方面的例子有不少,Google 的 Dapper、淘宝的鹰眼、eBay 的 CAL,以及在国内被众多厂商采用的,目前已经开源的大众点评的 CAT。服务器

应用监控系统不一样于像 Zabbix、Ganglia 这样的监控系统,后者侧重于对服务器的监控。应用监控系统能够是运维和开发人员了解到应用运行的内部细节状况。好比一次业务调用在系统内部涉及到了哪些调用,这些调用的关系是什么,调用的结果(状态、是否有重试、花费的时间等等)。同时,当内部调用出现问题的时候,监控系统还能够及时发现这些问题,避免问题夸大,加快问题的解决速度,减小运维和开发人员的重复工做。app

CAT

在作了大体的了解以后,我开始尝试 CAT 系统。可是搭建 CAT 服务的时候并非很顺利。编译并不困难,但以后的运行确实频频出错。issue #836 记录的比较详细。由于年前暂时没有 Linux 环境,因此运行 CAT 的尝试便没有继续下去。运维

过年的时候在移动硬盘上安装了一个 Ubuntu 系统,年后即可以继续运行 CAT 的尝试了。日志

Netflix Hystrix

Hystrix 的 Dashboard 功能使得开发运维人员能够在远程调用方面监控应用。因此,Hystrix 也是一个调研的方向。开发

相关文章
相关标签/搜索