屏蔽告警

屏蔽规则是一种在特定情况下暂时禁止告警通知的功能。通过设置屏蔽规则,可以避免在特定场景下不必要的告警通知,减少对我们的打扰。屏蔽规则一般有以下使用场景

  1. 计划性维护工作:在计划性维护期间,由于系统或服务可能会暂时关闭,这可能导致大量告警触发。通过设置屏蔽规则,可以在维护期间暂时禁止告警通知,避免造成不必要的打扰。

  2. 已知问题处理:对于已知问题,我们可能已经在处理了,此时不希望接收到重复的告警通知,可以设置屏蔽规则,暂时禁止这些告警通知,直到问题解决。

  3. 针对随机问题进行临时性屏蔽:在某些非关键时间段,如节假日、夜间等,我们可能希望暂时禁止部分非关键告警通知。通过设置规则中的生效时间,可以满足这个需求,确保我们能够专注于关键任务。

筛选条件

屏蔽规则像一个漏斗一样,根据筛选条件层层过滤条件,直到完成筛选条件并完全匹配上才会进行屏蔽。

屏蔽告警001

业务组:屏蔽规则只会对指定业务内的告警事件进行屏蔽。

数据源类型、数据源、事件等级:设定好后基本就可以将想要屏蔽的告警分类筛选出来了。

事件标签 Key:核心细化筛选条件字段,提高屏蔽规则的准确性。告警事件中所有事件标签都是可以作为过滤条件的。

屏蔽告警002

屏蔽告警003

匹配操作符:目前支持 ‘==’、’=~’、’ !=’、’ !~’、‘in’、’not in’ 6种操作符。

匹配操作符介绍

屏蔽告警004

“==”:绝对匹配标签的value

屏蔽对匹配标签 rulename 的值是“测试服务器挂载多个业务组告警”的告警规则。

屏蔽告警005

“=~”:通过正则表达式匹配标签value

屏蔽正则表达式匹配标签 ident 的值是包含 flashcat 或者是 v63-192.168.0.2 的告警规则;

屏蔽告警006

“!=”:绝对不匹标签的value(取反)

屏蔽匹配标签 ident 的值不是 pushgw-flashcat02-192.168.0.2 的告警规则。

屏蔽告警007

“!~”:通过正则表达式不匹配标签 value (取反)

屏蔽正则表达式匹配 ident 的值是不包含 flashcat 关键词的告警规则;

屏蔽告警008

“in”

屏蔽 ident 标签的值是 flashcat01-192.168.0.2 或 pushgw-flashcat02-192.168.0.2 的告警规则;

屏蔽告警009

“not in”

屏蔽 ident 标签的值不是 flashcat01-192.168.0.2 或 pushgw-flashcat02-192.168.0.2 的告警规则;

屏蔽告警010

匹配逻辑:多个事件标签匹配条件是自上而下的过滤,每个事件标签匹配条件之间是’且’的关系。

匹配条件范围:告警事件中的所有标签

屏蔽时长

针对屏蔽策略生效的时间范围,可以是一次性的,也可以是循环周期性的。

注意:需要屏蔽的告警事件的 triggertime 一定要在屏蔽时间范围之内,否则告警屏蔽规则无法生效。

屏蔽告警011

屏蔽时长默认是无法选择分钟级别,不过通过屏蔽开始和结束时间设定精确到分和秒。

屏蔽告警012