SugarNMS分布式网络运维部署攻略

      SugarNMS智和网管运维平台分布式部署监控、集中化管理方案,彻底解决某些用户网络规模庞大、分布广泛难以统一管理的难题。

      通过[SugarNMS](www.zhtelecom.com)智和网管平台统一网络管理及监测平台,将用户生产、办公相关网络设备纳入其中,实现用户整体网络管理监控,实时了解整体网络运行状态,预测分析网络运行质量,二级单位能够监控单位内部网络运行状态,掌握网络运行情况,快速判断、追踪定位并响应网络故障。

      采用综合-区域-设备网管-设备的结构,部署多级架构网管方案,上级网管可以查看下级网管(包含其子集)的监控信息。有新设备接入时可以增加设备网管或者区域网管。综合网管可以管理所有设备。下级网管对本区域内单位或本单位网络进行管理。每级网管可以单独监控各自的网络设备,也可以由综合网管集中管理。下级实现对各二级单位的网络设备运行数据的采集、管理、存储,集成数据库进行数据的本地存储,并通过安全的传输方式将数据上传至网管运维监控中心。

这里写图片描述

消除运维监控死角

      以网络可用性监控为主线,构建全覆盖的网络监控平台,能够主动、及时地发现问题,并调度资源解决问题,形成IT运维管理主动服务的新局面。

快速定位故障

      快速搜索设备,高效定位故障点,及时故障告警,灵活告警机制让管理人员第一时间掌握故障信息,迅速作出响应,快速恢复系统运行。建立集中的告警分析及展现平台,提供灵活、自动化的事件处理能力。

这里写图片描述

变被动管理为主动管理

      平台接收设备/服务器主动发送的消息,集中处理后,及时的通知用户,并可以通过集中的管理界面进行管理。接收设备/服务器主动发送的消息。改变二级部门传统管理的被动局面,随时掌握局域网运行情况,在正常生产受影响前,及时将故障排除,提供安全高效的网络环境。

实时流量管理

      支持对流量和带宽进行实时监控,并可自定义触发告警的流量临界值,全网采集流量信息,并将流量可视化展现。全方位采集流量信息,进行流量统计,总结流量使用的峰值、谷值、流量趋势、设备流量等数据,为企业网络管理提供有效的数据支撑。

分布式部署实例-中国移动北方十三省网络运维项目

      中国移动是我国三大移动运营商之一,公司主要经营移动通信业务,国内、国际固定电话网络与设施,语音、数据、图像及多媒体通信与信息服务,电信增值业务,IP电话业务等国家批准的其它业务,以及与通信及信息业务相关的系统集成等业务。

2010年中国移动通信集团在全国建设了不良信息过滤系统,此系统由不良信息过滤软件、Windows 服务器、Linux 服务器、数据库、分流设备、交换机、存储服务器等构成。

核心需求

      中国移动需要一套集中的OMC(操作维护中心)监控软件,对不良信息过滤系统的所有的设施进行监控,包括过滤软件、Windows 服务器、Linux 服务器、数据库、分流设备、交换机、存储服务器等。具体需求如下:

1.集中部署OMC,分域管理:各省市管理人员从Internet登录到OMC系统,对本省的设备进行监控;

2.穿透私网:要管理的设备分散在各省公司下不同城市的机房中, 网管服务器无法直接访问各省设备;在北京的中心机房,可以监控到其他机房的设备运行情况;

3.严格的故障处理机制:故障发生、故障通知、故障清除、故障确认、故障恢复,需要符合中国移动的运维管理规定;

4.时效性要高:发现故障的时间,平均不能低于30秒,最大不能超过1分钟;每台设备 10-20个需要监控的故障/性能指标,监控周期为10秒钟;

5.统一监控:所有的服务器、网络设备、软件系统在同一界面中统一监控;

6.7*24 小时的监控画面:主监控屏幕需要7*24小时不间断展示告警和警报。

智和信通解决方案

      智和网管平台已实现包括设备拓扑、故障管理、性能管理、配置管理以及安全管理等在内的超过1000种基础网管功能,且支持功能扩展。针对中国移动的具体需求,智和信通提出以下解决方案:

(1)智和网管平台利用WebService技术采用集中式部署网管软件,分布式部署的网管采集代理,实现中心、片区的层级监测,片区独立运行,中心可以集中管理分部的监测数据;

(2)配置代理服务器的IP和端口,做到采集服务端的代理模式,可以做到监控私有网段下的设备;

(3)具备主动的故障监控功能,能从众多的事件和状态中,系统将零散的状态信息,总结成为当前工作状态,并产生告警,可以用声音、邮件、短信及时提醒网管人员;

(4)采用JAVA多线程任务并发技术,把监测频率提升到秒级,以保证监测数据的实时性和精确性,监控周期最低可以设置为5秒;

(5)智和网管平台采用了设备统一模型,可以统一管理Windows 服务器、Linux 服务器、数据库、分流设备、交换机等各种设备类型;

(6)客户端与服务端之间网络故障恢复后,网管客户端无需重启,自动恢复,数据库停机/故障恢复后,网管系统客户端、服务端无需重启,自动恢复,支持双机热备功能。

方案成果

      智和网管软件凭借着优秀的秒级故障监控能力、直观的拓扑图界面展示、特有的分省Proxy SNMP 网关技术、稳固的故障提示和警报提示, 最终在中国移动不良信息过滤系统的北方区域:北京、天津、黑龙江、吉林、辽宁、山东、山西、甘肃、青海、西藏、河南、宁夏共13个省公司 全面上线使用,并通过了极为严格的功能验收和性能验收。


这里写图片描述

智和网络运维平台