8. 服务监控
总览
服务监控(services monitoring)旨在帮助那些想要高级(业务)基础设施的监控的人。在许多情况下,我们关注的不是底层细节,比如磁盘空间不足、CPU 负载高等。我们关注的是IT部门提供的可用性的服务。我们还对确定IT基础设施薄弱的地方,IT各种服务级协定(SLA),现有的IT基础设施的结构,以及其他的信息感兴趣
Zabbix 服务监控(services)对提到的问题提出了解决方案。
服务(services)是分层表示监控数据。
下面来看一个简单服务的例子:
- IT Service
- |
- |-Workstations
- | |
- | |-Workstation1
- | |
- | |-Workstation2
- |
- |-Servers
该结构的每个节点都具有属性状态。根据选择算法进行状态计算并传播到上层节点。服务(services)最底层的服务是触发器。该节点的状态依赖于触发器的状态。
注意,触发器不分类或信息的严重程度不影响SLA计算。
配置
配置服务(services),请访问:配置(Configuration)→服务(services)。
在该界面,您可以创建一个分层次的监控结构。最高的父节点服务是 'root'。您可以通过添加低级服务节点和各个节点服务创建下层层次结构。
点击 Add child 添加服务(services)。可以单击其名称编辑一个现有的服务。您可以通过弹出的表单编辑服务属性。
配置一个服务(services)
服务选项卡包含通用服务属性:
参数 | 说明 |
---|---|
名称(Name) | 服务的名字。 |
上层服务(Parent service) | 父节点。 |
状态计算算法(Status calculation algorithm) | 服务状态计算方法:不计算 - 不计算节点状态问题,如果至少一个子节点有一个问题 - 只要一个子节点有异常,该节点就异常。问题,如果所有的子节点都有问题 - 当且仅当所有子节点都有异常,该节点才异常。 |
计算SLA(Calculate SLA) | 是否计算SLA的百分比。 |
可接受的SAL(% 计)(Acceptable SLA) | 这个服务SLA百分比是可以接受的,用于报表。 |
触发器(Trigger) | 选择关联的触发器:None - 没有关联的触发器触发器名称 - 连接到触发器,节点的状态取决于触发器状态在最底层的服务必须依赖触发器。(否则节点状态会显示不对。)\当触发被链接,其链接以前的状态是不计数的。 |
排序(Sort order) | 显示的顺序,数字小的优先 |
依赖关系(Dependencies)选项卡可以看到该服务的所有子节点。单击Add单添加一个之前配置过的服务。
硬依赖和软依赖
服务可用性可以取决于若干其它服务,而不是仅仅一个。第一选项是直接添加为子节点。
然而,如果一些服务已经加入到其他的服务树,它不能被移动到这里作为子节点。如何创建?答案是 “软” 连接。添加服务并勾选 Soft 复选框。这样的服务可以留在原来的位置在树上,还依赖于其他服务。“软链接”的服务在服务树种显示是灰色的。另外,如果一个服务只有一个“软链接”的子节点,就可以删除此服务,而不用删除软链接的子节点。
时间(Time)选项卡用于设置服务的工作时间。
参数 | 说明 |
---|---|
服务时间(Service times) | 默认地,所有的服务都将24x7x365操作。如果例外需要,添加新的服务。 |
新服务时间(New service time) | 服务时间:工作时间(Uptime) - 服务正常运行时间维护时间(Downtime) - 维护时间状态的时段内不会计算SLA百分比。一个时间-停机(One-time downtime) - 一次性的维护时间。维护时间状态的时段内不会计算SLA百分比。添加相应的时间。注意: 服务时间仅影响其配置的服务。 因此,父节点服务不会考虑在子节点服务上配置的服务时间(除非在父节点服务上配置相应的服务时间)。在前端计算服务状态和SLA时,会考虑服务时间。 然而,不管服务时间如何,关于服务可用性的信息会被连续地插入到数据库中。 |
前端显示
服务(services)监控, 去 监控中(Monitoring) -> 服务(services).