8. 服务监控
概览
服务监视功能适用于希望获得被监视基础设施的高级(业务)视图的人。一般情况下,我们对低级别细节不感兴趣,例如磁盘空间不足、处理器负载高等。我们感兴趣的是整个 IT 部门提供的服务的整体可用性,以及对识别 IT 基础设施的薄弱环节、各种 IT 服务的 SLA、现有 IT 基础设施的结构以及其他更高级别的信息。
Zabbix 服务监控为所有提到的问题提供了答案。
服务监控允许创建监控数据的层次结构表示。
一个非常简单的服务结构可能如下所示:
Service
|
|-Workstations
| |
| |-Workstation1
| |
| |-Workstation2
|
|-Servers
结构的每个节点都有属性状态。根据所选算法计算状态并将其传输到上层。各个节点的状态受映射问题状态的影响。问题映射是通过 标签 完成的。
如果检测到服务状态发生变化,Zabbix 可以在 Zabbix server 上发送通知或自动执行脚本。可以根据子服务的状态来定义父服务是否应该进入 ‘问题状态’ 的灵活规则。然后可以使用服务问题数据来计算 SLA 并根据灵活的条件集发送 SLA 报告。
服务监控在 Services 菜单中配置,该菜单由以下部分组成:
服务部分允许通过添加父服务来构建受监控基础架构的层次结构,然后将子服务添加到父服务。
除了配置服务树之外,本节还提供了整个基础架构的概述,并允许快速识别导致服务状态更改的问题。
在本节中,您可以配置服务动作。服务动作是可选的,并允许: - 发送服务宕机的通知; - 在服务状态发生变化时在 Zabbix server 上执行远程命令; - 当服务再次启动时发送恢复通知。
在本节中,您可以定义服务水平协议并为特定服务设置服务水平目标。
在此部分中,您可以查看 SLA 报告。
可以参照: