3 配置示例

概述

该章节向用户展示了如何简单地配置一个服务用来监控Zabbix的高可用集群。

前提条件

在配置服务监控之前,用户需要先配置对应的主机:

  • HA node 1 至少配置一个触发器和一个标签(推荐在触发器级别配置)component:HA node 1
  • HA node 2 至少配置一个触发器和一个标签(推荐在触发器级别配置) component:HA node 2

服务树

在完成上述步骤后,下一步需要建立服务树。在此示例中,只包含架构的基础配置。该配置包含三个服务,分别是:Zabbix cluster (父)和两个子服务Zabbix server node 1Zabbix server node 2

  1. Zabbix cluster
  2. |
  3. |- Zabbix server node 1
  4. |- Zabbix server node 2

在服务配置页面,打开编辑模式并点击创建服务:

3 配置示例 - 图1

在服务配置窗口中,输入服务名称Zabbix cluster并点击Advanced configuration(高级配置)标签以显示高级配置选项。

3 配置示例 - 图2

配置附加规则:

3 配置示例 - 图3

Zabbix cluster 将拥有两个子服务,用于各自的HA节点。如果双方的HA节点均产生至少为Warning级别的告警状态,父服务状态应设定为Disaster。要实现如上所述的配置,用户需要配置下列附加规则:

  • Set status to: Disaster
  • Condition: If at least N child services have Status status or above
  • N: 2
  • Status: Warning

用户需切换至标签面板并添加标签Zabbix:server。该标签后续会用于服务动作和SLA报告。

3 配置示例 - 图4

保存新建立的服务。

点击Zabbix集群服务旁边的加号图标(只有编辑模式才能看到加号图标)来创建子服务。

3 配置示例 - 图5

在服务配置窗口输入名称Zabbix server node 1。注意,父服务的参数已经用Zabbix集群预先填充了。

该服务的可用性受主机HA node 1产生的问题所影响,通过component:HA node 1 问题标签所标记。在问题标签参数中输入:

  • 名称:组件
  • 操作: 等于
  • 值: HA node 1

3 配置示例 - 图6

切换到 标签 面板并添加服务标签:Zabbix server:node 1。此标签会用于后续的服务动作和SLA报告。

3 配置示例 - 图7

保存新建的服务。

创建另一个子服务 “Zabbix server node 2”.

设置问题标签:

  • 名称:组件
  • 操作:等于
  • 值:HA node 2

切换到标签 面板并添加服务标签:Zabbix server:node 2

保存新建的服务。

SLA

在此示例中,预期的Zabbix集群性能是100%,排除了每半年一次的一小时维护时间。

首先需要添加一个服务级别协议。

转到 服务->SLA 菜单点击创建SLA。输入名称 Zabbix集群性能 并 设置SLO为100%。

Zabbix集群有 Zabbix:server标签。要使用该SLA来测量Zabbix集群的性能,需要在服务标签的参数中指定:

  • 名称:Zabbix
  • 操作:Equals
  • 值:server

3 配置示例 - 图8

在实际设置中,还可以更新所需的报告周期、时区和开始日期,或把时间表从24/7改为自定义。就这个例子来说,默认设置就够了。

切换到例外停机时间 面板并添加用于例行维护的停机时间,这样SLA就不会将这些时间段计算在内了。在例外停机时间面板总点击添加(Add)链接,输入停机时间名称、计划开始时间和持续时长。

3 配置示例 - 图9

点击添加(Add)来保存新建的SLA。

切换到SLA报告界面查看关于Zabbix集群的SLA报告。

3 配置示例 - 图10

还可以在服务 界面下查看SLA信息。

3 配置示例 - 图11