Zabbix一手应用问答
Q1 Zabbix支持集成scom,splunk等其他的监控系统的告警和性能数据吗?
A1 Zabbix支持通过API或者数据库ETL集成其他系统或者平台。除此之外,当SCOM、SPLUNK等数据收集上来时,也可以通过调用Zabbix_sender的方式集成到zabbix中。
Q2 跟BMC相比的话 ,除了价格,Zabbix有一些什么其它的优势呢?
A2 Zabbix有很多优势,如可扩展,接口丰富,易于同其他平台集成。支持各种平台的Agent使其在深度和广度上超越了大多数的监控工具。
Q3 支持基于动态基线的阈值告警吗?
A3 不支持,但在最新的版本中支持预测。
Q4 一台机器上有多个进程或者多个端口等监控也是通过LLD去实现吗?
A4 可以自定义发现原型来实现LLD。
Q5 如果长时间没采集到值,是否可以告警通知出来?
A5 可以,Zabbix支持nodata报警,即当没收到值的时候,将报警发出。
Q6 Zabbix可以实现apm的监控吗?
A6 根据需求可以部分或者全部实现,Zabbix支持原生的JMX监控。
Q7 agent端和server端需要开通哪些端口?
A7 Zabbix本身只需要开通10050,10051端口(主动、被动监控)。如需要监控Agent端其他服务(如80,443等),则需要额外开通。
Q8 我们遇到一个问题,通过ZabbixAPI创建监控项,然后通过pyzabbixSender推送数值到Zabbix,但是不能即可成功,这是什么原因呢,必须要等到一段时候后才能成功。
A8 Zabbix Server和Proxy同步时定期的,在早期版本默认时3600s,需要修改conf文件以加快同步周期。
Q9 我们的系统内部的主机也高达1.1w,但是我们遇到了很多队列积压的问题,修改了很多Cache的大小,还是效果不佳。
A9 是否需要修改cache大小取决于Zabbix
internal check中的busy或者free的百分比,与queue没有直接关系。queue的堆积可能是网络延迟、agent端的响应缓慢造成的,需要具体分析。
Q10 Zabbix的自动发现是基于安装客户端的主机么?
A10 Zabbix的自动发现功能可以基于客户端,也可以基于协议(如http,ftp),按指定的规则将符合规则的主机加入监控。
Q11 Zabbix加载更多的面板会影响性能吗?
A11 加载更多的面板会导致Zabbix数据库的读压力增加。如果可以进行合理调优,那么影响不大。
Q12 现在推荐哪个版本呢?
A12 最新的版本是3.4,如果是开源使用建议使用这个版本。如果需要商业支持,可以考虑3.0LTS,以获得更多的商业支持生命周期。
Q13 什么样的规则(通过什么方式)可以区分自动发现的机器是windows还是linux的主机?
A13 首先网络发现的网段的操作系统需要安装Zabbix
Agent,可以通过网络发现,并配置获得的key为system.uname。Windows系统,key的返回会包含Windows这个字符串;同样的linux系统也会包含“Linux”这个字符串。根据返回值配置后面的动作(加组、套用模版等)。
Q14 一般多少数量的主机才需要用到proxy?
A14 这个问题没有固定的答案,看具体的业务场景和需求。建议安装网络区域部署Proxy以减少防火墙需要打通的端口。
Q15 主机性能,每秒刷新值达到100这个值是不是很大了?
A15 可以说非常小了,官方的最大部署中,nvps可以达到几十万。
Q16 自动化发现后,可以修改监控项么?
A16 可以修改,如果修改原型的监控项,会更改所有关联该模版的主机。如有个性化需求,可以在单个host上单独添加。
Q17 带外怎么自动监控ipmi
A17 可以通过Share上的模版,结合网络发现功能,自动为带外网络发现到的Host关联并添加监控。
Q18 我们现在使用Zabbix监控,服务器数量1000不到,但是查看监控图形时,图形会出现断裂,如何解决呢?
A18 出现断裂可能是数据库没有数据,或者Agent端根本没有收集到数据。前者可以通过数据库调优解决,后者可以在Agent本机观察负载情况,以定位问题。
Q19 自动发现里面怎么修改模板来排除特定的名字的监控项,只留下同类型的需要的监控项,因为我在部分网络设备上的发现会出现很多虚的用户接口也被抓进监控项,数量很大,怎么排除。
A19 可通过常规中的正则表达式功能,为自动发现排除不需要的Item。
Q20 Appliance版本 VMware Workstation Pro可以用吗?
A20 可以,下载vmdk文件,并挂载到VM中就可以使用。
Q21 最近经常出现Zabbix server无法获取proxy数据的情况,每次都需要禁用部分proxy,然后重启Zabbix server,再逐一将proxy分别启用才能恢复。请问这个是配置参数原因导致的,还是Zabbix的bug。
A21 Server和Proxy同步有周期,早起版本3600s,在conf文件中修改配置以缩短同步时间。