项目需求:
       
某投资公司是一家大型印刷类公司,属于高科技公司。在中国的办公总部设立在深圳,其中在上海,北京,苏州,广州,成都等地都设有分部或办事处。公司拥有的软硬件设备种类繁多,机房环境复杂,同时拥有多条业务系统,机房环境、业务系统的安全、稳定运行对印刷生产线起到至关重要的作用,自动化运维系统业务成为企业当前的重要问题。次公司存在运维服务路径不统一,无法形成首问责任制,难以做到统一调度、统一监管;服务报告、知识管理体系不完善,经验难传承;没有形成标准化运维体系,且没有信息化系统为支撑,运维过程无法标准化;服务成果难以量化,服务价值难以体现;没有形成系统规范的运维商服务过程监督体系、手段、服务质量量化考核标准;故障响应/处理不及时、过程不合规、操作不规范、服务报告不完善;各种例行类服务没有按计划执行,没有提供服务报告。综上自动化运维管理系统业务是网络工程部门急需解决的问题。
解决方案:
       
完成主中心监控平台(主要组件包括:Zabbix、Grafana、influxDB)的安装、配置和联调,实施监控平台在上海与深圳两地互备的高可用架构,其中MySQL数据库将通过binlog实现远程数据复制,Zabbix Server将通过keepalive实现双机集群,信息采集手段包括:部署agent、通过SNMP协议、和ping命令采集源、Zabbix Server和MySQL数据库之间都通过浮动IP通信。对上海(兰生、青浦、金山、灾备数据中心)及深圳管理对象进行接入以及配置工作,包括OS层级的采集程序安装和配置,进行数据采集,采集后,在Zabbix界面中对所需监控的设备和指标项、告警等进行配置工作,并在zabbix中对基础指标进行第一层基础展示。基于Grafana界面中展示接入设备指标经行抽象提取定制化进行第二和第三层上次展示。告警信息以文本的格式转发至由最终用户提供的邮件正文或微信公众号正文。后期对管理员进行培训,内容包括Zabbix开源软件介绍、Grafana开源软件介绍、influxDB开源软件介绍,以及日常维护操作培训。
       此次部署运维监控平台中涉及此投资公司分布共计1908台设备,覆盖到思科安全、无线、交换机等产品
实现效果:
1、通过对公司的自动化运维平台的搭建和高可用主从模式的部署,加强了全国各区域工厂之间的联系反馈和数据信息安全;
2、大屏展示系统和业务数据报表的定制化开发,既做到细节展示,又做到实时更新,让客户了解到各个设备的实时状态,掌控业务数据的整体发展进度;
3、通过邮件或者微信告警信息的及时发送,缩短了运维工作人员准确排查故障时间,提高了工作效率,有效节省运维人员工作时间且降低了其中的人力成本。达到降低对公司业务和应用系统的损失,同时还为公司的安全化生产加上保障。
截图展示:

定制化首页展示页面







在线留言