某航空公司智能监控
项目需求:
现有监控系统不能满足运维需求,没有网络链路监测,人工巡查无法及时发现故障,通常只有使用者反馈后才得知故障发生,且并没有主动告警,无法快速定位故障原因,没有报表系统,无法对设备的运行状态进行直观展示。
解决方案:
根据项目需求安装、配置和联调航空公司监控平台,主要组建包括Zabbix、Mariad,完成监控平台在此航空公司分部所有节点物理机房位置拓扑图,网络拓扑图,物理链路状态图,形成子母拓扑图的样式。信息采集手段包括SNMP协议、和ICMP命令采集源、Zabbix Server和MariaDB数据库之间通信。根据航空公司分部各节点网络设备管理对象进行接入,涉及到添加监控项(监控的核心设备的CPU、内存、存活、板卡、电源、风扇、温度、带宽,接口流量,端口状态),对接入层网络设备和摄像头,无线AP进行每天2次存活监测。为方便日后运维和扩容,将监控的网络设备的监控项做成模板,进行数据采集,采集后,在Zabbix界面中对所需监控的设备和指标项、告警等进行配置工作,并在zabbix中对基础指标进行第一层基础展示。根据需求,进行相关个性化定制和开发,包括大屏展示、树形图、物理链路专线和互联网链路模块、机房展示模块框架、事件日志记录。后期对管理员进行培训。
此次部署运维监控平台涉及航空公司信息分布共计559台设备,覆盖华为、Cisco、H3C三个厂家网络设备。
实现效果:
1、对各公司、各营业部、各机库实现统一平台管理,提高管理效率,降低成本;
2、对服务器、网络设备进行统一资产管理,解决了纯人工管理资产混乱的现状;
3、对网路设备进行统一配置管理,发生设备配置变更、丢失等情况,可快速对网络故障进行自动定位且发出告警通知工程师,工程师可根据用过系统自动备份的配置对设备进行配置的快速修复;
4、实现对端到端网络链路的流量、状态监控,发生问题及时发出告警通知,管理员进行故障修复,保障链路通畅。
截图展示:
大屏展示系统
拓扑图