项目需求:
1、与公司成都研究所综合网管(UNMS)做对接,上报部分关键告警给UNMS;
2、
与客户的安全审计系统(SOC)做对接,把网管的日志发给SOC系统进行分析处理;
3、
与邮件和短信系统对接,支持两种通知方式;
4、
按埃塞客户的需求进行定制报表,如可用性报表,故障设备报表等。
解决方案:
      
根据项目需求,进行HA高可用监控平台分布式部署(主要组件包括:Zabbix、Mariadb、Agent)的安装、配置和联调,服务器系统:Centos 7.2,完成Agent代理安装,支持windows、linux、unix。信息采集手段包括:通过Agent代理、SNMP协议、和ICMP协议采集源。整理将用于采集具体某一设备所需的信息(如设备名称、IP地址、用户名、密码等信息)登记,整理并提供现有采集指标,对OS层级的采集程序进行安装并配置,开启和设置网络SNMP等。充分和客户协调和沟通技术难点和可行性后,执行数据采集定制化内容,数据采集后,在Zabbix界面中对所需监控的设备和指标项、告警等进行配置工作,并在Zabbix中对基础指标进行展示。针对客户需求,进行定制报表(可用性报表、故障设备报表等)。后期进行管理员培训。

监控类型 支持范围 设备量 监控项
服务器

Linux、Windows

物理机:50
VM虚机:600

主机存活、运行时间、CPU负载、内存使用率、磁盘使用率、网卡流量、网卡状态、进程数量、日志关键字监控

数据库

MySQL、MS SQL、Oracle、PostgreSQL

23

数据库存活状态、进程状态、端口状态、数据库实例状态、表空间大小、会话数、访问并发量、读写并发量、死锁数

中间件

IIS、Tomcat


端口状态、进程状态、响应时间、会话数

存储

IBM V5000

2

设备存活、设备运行时间、端口状态、读写速度、读写队列、读写延迟、硬盘使用率

应用

139邮箱、DNS


URL状态、模拟登陆、模拟退出、响应时间、下载速度

实现效果:

1、系统发生问题及时发出告警通知(邮件等方式),管理员能够快速进行故障定位及修复,保障链路通畅,有效降低了其中的人力成本,缩小对公司业务和应用系统的损失;
2、实现统一平台管理,提高管理效率,降低成本。对服务器、网络设备进行统一资产管理,解决了纯人工管理资产混乱的现状;
3、通过提供定制化报表,包括实时性能、事件、单击多指标、多机单指标等形式的报表,同时可通过文字型和图标型两种方式展现报表,最大限度地方便客户进行报表的统计分析。





在线留言