项目需求:
Linux、Windows
主机存活、运行时间、CPU负载、内存使用率、磁盘使用率、网卡流量、网卡状态、进程数量、日志关键字监控
MySQL、MS
SQL、Oracle、PostgreSQL
数据库存活状态、进程状态、端口状态、数据库实例状态、表空间大小、会话数、访问并发量、读写并发量、死锁数
IIS、Tomcat
端口状态、进程状态、响应时间、会话数
IBM V5000
设备存活、设备运行时间、端口状态、读写速度、读写队列、读写延迟、硬盘使用率
139邮箱、DNS
URL状态、模拟登陆、模拟退出、响应时间、下载速度
1、与公司成都研究所综合网管(UNMS)做对接,上报部分关键告警给UNMS;
2、与客户的安全审计系统(SOC)做对接,把网管的日志发给SOC系统进行分析处理;
3、与邮件和短信系统对接,支持两种通知方式;
4、按埃塞客户的需求进行定制报表,如可用性报表,故障设备报表等。
解决方案:
根据项目需求,进行HA高可用监控平台分布式部署(主要组件包括:Zabbix、Mariadb、Agent)的安装、配置和联调,服务器系统:Centos 7.2,完成Agent代理安装,支持windows、linux、unix。信息采集手段包括:通过Agent代理、SNMP协议、和ICMP协议采集源。整理将用于采集具体某一设备所需的信息(如设备名称、IP地址、用户名、密码等信息)登记,整理并提供现有采集指标,对OS层级的采集程序进行安装并配置,开启和设置网络SNMP等。充分和客户协调和沟通技术难点和可行性后,执行数据采集定制化内容,数据采集后,在Zabbix界面中对所需监控的设备和指标项、告警等进行配置工作,并在Zabbix中对基础指标进行展示。针对客户需求,进行定制报表(可用性报表、故障设备报表等)。后期进行管理员培训。
监控类型
支持范围
设备量
监控项
服务器
数据库
23
中间件
存储
2
应用
实现效果:
1、系统发生问题及时发出告警通知(邮件等方式),管理员能够快速进行故障定位及修复,保障链路通畅,有效降低了其中的人力成本,缩小对公司业务和应用系统的损失;