监控中心
介绍
该模块提供了以下几种常用的监控模式
站点检测
通过
GET
请求指定的 url 匹配返回的状态码来确定站点是否异常,目前200 - 399之间状态码均为正常,否则为异常,默认超时时间为 10 秒。端口检测
检测指定目标主机的 TCP 端口是否可以正常建立接连。
Ping 检测
(
v2.3.10
新增)使用Ping
检测目标主机是否存活,默认超时时间为 3 秒。进程检测
检测指定目标主机的某个进程是否存活。
自定义脚本检测
在指定主机上运行自定义的脚本,通过判断返回的退出状态码是否为 0 来确定是否有异常。脚本执行中输出的内容将作为报警的描述信息,可利用此特性来灵活控制 报警的规则和报警的内容。
配置说明
- 监控频率: 每隔多长时间检测一次
- 报警阈值: 连续指定次数检测失败后才会触发报警,例如:报警阈值设置为3,则表示当出现故障时连续3次检测都为失败的情况才触发报警
- 报警联系人组: 报警联系人的集合,可以包含一个或多个报警联系人
- 通道沉默: 相同的检测失败事件在通道沉默周期内只触发一次报警,避免过于频繁重复的报警信息。例如:通道沉默设置为 5 分钟,第一次触发报警后,5分钟内再次触发相同的报警信息则不会发送。
- 报警方式 目前支持微信、钉钉和邮件三种报警方式,内置开箱即用的微信和邮件报警服务,需要关注下方服务号 Spug 获取调用凭据,将调用凭据配置至系统设置 / 报警服务设置 中的调用凭据中。
- 微信报警,需要设置报警联系人的微信 Token,获取方式与获取调用凭据相同
- 钉钉报警,需要设置报警联系人的钉钉机器人 URL,请在钉钉群-安全设置里面添加部署服务器的外网 IP,或者设置关键字
通知
- 邮件报警,需要设置报警联系人的邮箱地址