单位已花费很低成本采购一套运维管理系统,大屏展现等作的很花梢,打算好好用起来,按照运维实用的角度,发现里面基本是默认配置,要想用好,基本须要从新配置一番,简单调整下,发现一些bug,甚是不爽,因而弃坑。java
按照支持开源的精神(折腾的原则),一线大厂的号召(至少前面有人踩坑),选择prometheus,开工linux
按照网上的指引,配置,部署是蛮快的,简单启动。但接下来,路就漫长,开始添加监控的目标设备,使用文本拼接方式批量添加,还能接受,因为网络设备,确定要用SNMP,部署snmp-exporter,添加项上就头疼,先要编写yml文件,再生成,再从新加载,更头疼的是oid,两三次下来,只能放弃。web
想学学大厂的运维,要让星星之火燎原,不是那么容易。数据库
天然相到的是小米开源的open-falcon,借鉴前人在分布式监控的经验,小米、滴滴等实践,看到详细(复杂)的架构图,想着集成度应该蛮高,查阅官方文档,再次搭起来环境,可启动后,尝试不到半个小时,没有搞清逻辑,再次放弃。windows
不是open-falcon很差,实在是骨骼清奇,非高手不能掌握(也许被prometheus的简单贯坏了)api
在选择监控之时,已经被大厂洗过脑,他们是以为zabbix不行,才另起炉灶,按照开源的规律(套路),那天然是要甩zabbix几条街的,一开始我就没关注,坑不能再踩呀,但折腾一番后,发现没有选择,无奈只好回归zabbix
zabbix是一款老牌的监控系统,固然界面可能有着浓浓的时代风格,尤为是图表,总之,提不起兴趣,但看其官方网站zabbix.com,渐渐有些好感,号称支持云、IOT,甚至监控一切1服务器
UNLIMITED CAPABILITIES IN AN ALL-IN-ONE MONITORING SOLUTION
今后一入zabbix深似海网络
在花费近一个月在监控平台选择的折腾,渐渐发现走偏的缘由。没有贴合实际:单位几乎传统的公司的信息化架构
以前有个监控就行,基本没有人员关注,有问题用户会报,监控看了徒增烦恼,监控也简单:监控网络设备状态、监控服务器状态cpu、mem、磁盘状态等,所以,基于容器、云的监控系统,prometheus等很难发挥其优点,相对容器,传统IT的监控类型实在太多样,太复杂运维
zabbix相对优点:
zabbix的特别适合小规模的信息化监控,尤为是中小企业,简单实用。因为高度定制化,对于有个性化监控需求,内置模板、函数、插件、api,充分给予发挥想象力的空间