某科技公司智能监控
项目需求:
成都某科技有限公司的软硬件设备种类繁多,设备数量较大,发生故障时,会产生海量告警信息,增加运维人员工作量,且无法快速定位故障原因。综上该公司需要搭建自动化运维高可用平台解决上述问题。
解决方案:
根据项目需求安装、配置和联调上海纵立正式生产区和开发测试区共计两套的Zabbix高可用监控平台,主要组建包括Zabbix、MairaDB、Agent、Check,完成监控平台在上海纵立所有节点的网络拓扑图。安装并配置OS层级的采集程序,充分协调及沟通技术难点及可行性,进行数据采集定制,数据采集后,在Zabbix界面中对所需监控的设备和指标项、告警等进行配置工作,并在Zabbix中对基础指标进行展示,进行监控模板定制化开发,对服务器、网络设备及存储设备添加,完成设备信息录入,关联模板及测试模板获取数据是否正常,完善设备信息。基于Zabbix标准功能,对流量、丢包率、状态、响应时间等实施网络链路监控,针对网络设备配置变更告警、备份功能,部署监控告警(声音、短信、邮件、微信),与纵立系统对接,完成整个平台的部署。后期对管理员进行培训。
项目管理对象
|
服务器:HP、DELL、IBM、Lenovo
存储:HP、IBM、Horeb、
交易中间件:Tibco RV、Tomcat
数据库:Oracle
网络:IBM、HP、HW、Fortinet、Sangfor、SG1200
虚拟机:Redhat、WindowsWin Server 2012、 WindowsWin-7、Suse
摄像头:HoneyWell
|
实现效果:
1、
服务器及进程管理:通过对通用服务器的监控管理(主要为windows、Linux、HP-UNIX、HANA一体机等系统监控),自动发现网络中服务器设备的信息,实时采集服务器的状态和性能等信息,实时采集服务器中当前运行的进程信息。
2、
网络设备管理:通用网络设备的监控管理,主要是交换机、防火墙、负载均衡、路由器等设备监控,自动发现网络中的设备,采集设备相关信息(基本信息,接口信息,连接状态等),可动态展示实时网络负载、流量分布、运行时间等。
3、
中间件管理:实时采集并显示中间件的服务状态、会话状态、消息队列状态。
4、存储设备管理:通用存储设备的监控管理,主要是设备的硬件状态,逻辑状态及日志的管理。
5、数据库管理:实时监听和分析数据库的连通状态、性能状态、表空间状态、锁状态等,可分析sql语句的执行性能和执行结果。
6、虚拟化管理:实时采集虚拟化系统的性能、可用性、配置等信息。直观展示虚拟化系统的状态以及虚机的可用性。
7、监控系统管理:实时采集监控平台数据,可实时查看监控画面,实时报警提醒。
截图展示:
树形图展示