Q:用Zabbix怎么去监控IBM的power服务器(硬件方面的)算法
A:硬件监控,ipmi 和SNMP,带外管理口集成docker
Q:ipmi获取数据有时候回拉不到数据库
A:ipmi的监控zabbix低版本的的确轮训会不好,有这个问题,Zabbix在升级版本中也一直对这块作了优化,尽可能用高版本的Zabbix缓存
Q:ipmi 监控IBM服务器硬件的时候常常获取不到数据,监控效果不好服务器
A:是的,Zabbix的每一个版本都有所优化,ipmi也有相应的配置参数,相对调整也能够加快轮训网络
Q:业务监控怎么作的oracle
A:咱们是分两层作的,一个业务自己可用性监控,一个是依赖监控,而后创建关系函数
Q:有用容器作Zabbix-server进程的案例吗?工具
A:有,作过测试
Q:业务数据怎么作
A:业务数据须要单独作,咱们一般是独立作一个应用再与咱们的平台集成,集成主要在显示层
Q:Oracle的监控,能详细说说吗
A:咱们让DBA独立写的监控脚本,放弃了orabbix
Q:zabbix案例中最多监控多少设备?实施
A:看item
Q:大家代码开源了吗?
A:咱们研发了好久,投入很大,代码暂时不开源,计划明年开放一部分功能
Q:老师你好,能讲讲Zabbix对docker容器的监控方案吗?
A:基本:运行状态数量、统计数量、版本、暂停状态数量、中止状态数量
自动发现:IO读写操做字节数、容器状态、CPU使用率百分比、磁盘使用、内存限制值、内存使用率、网络收发字节、总缓存、交换分区、运行时间等等
Q:Zabbix Server做为监控处理中心,怎么作高可用?
A:WEB层,DB层,Proxy,层层实现,建议作一层冷备
Q:请问,如何作预警?
A:3.0以上就已经有这个功能了,经过相似Forecast这样的函数实现,Forecast
Q:这两个函数效果通常,有没有更好的办法?
A:原生的只要这两个,能够结合多种表达式作优化。
Q:监控触发报警的阀值,能根据历史采样数据作到动态设置吗
A:如今还不行,trigger仍是静态的,须要作二次开发
Q:您好!如何把不一样的磁盘分区报警发给不一样的人,如WebLogic分区告警发给中间件管理员,oracle分区报警发给数据库管理员,有什么好办法吗?
A:经过告警和报表订阅实现,Zabbix原生尚未
Q:容器上跑Zabbix-server的坑能讲讲吗?
A:咱们2015年用docker跑过,发现了一些问题,好比说JDBC当时没有提供,监控不了数据库,最近的版本尚未尝试。
Q:Zabbix-server的高可用,通常用什么组件实现?zookeeper?keepalive?仍是其余的?
A:咱们用keepalive
Q:刚才你提到的IBM的小机的带外管理口是指HMC管理口吗
A:是的,拿Zabbix监控硬件须要掌握原厂的MIB库
Q:请介绍下如何作告警收敛的?
A:咱们作了管理上的收敛,Zabbix原生能够配置告警依赖,另外触发器事件模式配置单重等,计划将来在实践不尝试去作告警的智能收敛,这个步骤咱们会相对谨慎,宁肯适当多发,也不漏发,避免影响监控的覆盖率和准确率
Q:监控触发报警的阀值,能根据历史采样数据作到动态设置吗,有结合一些数据挖掘算法的案例吗
A:须要二开
Q:Zabbix和自动化部署工具,如salt集成有这方面的经验吗?
A:作过一些测试,使用salt自动部署须要解决的问题
1. rpm包的打包(这个问题不大,官方有提供)
2. rpm 安装(pkg模块)
3. 配置文件调整(file模块)
4. 服务自启动(service)
5. 配置文件的适配(使用salt的pillar实现)
基本上涉及salt的pkg(包管理模块)、file(文件管理模块)、service(服务管理模块)、pillar模块这四个模块。
Q:Zabbix的版本升级有没有坑?
A:按官方提示操做,逐渐升级版本
1. 不建议跨版本升级,由于版本间可能有表字段的变动,版本跨越太大可能致使系统没法运行
2. 若是非要跨版本升级的话,建议将主机和模板导出,部署完再作导入
3. 若是不是研究的话,版本升级不建议太激进