某个告警除了某个组的人关心,可能其他人也关心,就配置订阅规则,比如K8S平台的运维人员要作为告警接收人来接收所有K8S的告警,但是K8S的一些重大网络故障会影响整个K8S集群上面的业务方,上层业务也会关心这类告警,此时业务方就可以订阅K8S集群的部分重大告警。

    对于订阅规则,还有一种场景,比如运维团队管理了公司所有的告警规则,比如内存利用率的告警,不同业务线的人只关心自己的,那不同业务线的人就可以通过订阅规则,只订阅自己业务线的机器的告警。只需简单的为这批机器打上业务线标签,就可以通过这些标签做过滤。

    当然,有的公司推行DevOps文化,自己的狗粮自己吃,自己的服务自己运维,我这个业务线关心哪些告警,就自己创建一个业务组,配置相关策略,跟别的业务线没有任何关系,也不需要由特定的某个团队帮我配置,这样也是可以的,不同公司文化不同,组织架构职能分工不同,大家就根据自己的公司情况来规划即可。

    不过,从性能上讲,建议多使用订阅规则,让整体的告警规则变少,因为告警规则每次判断,都要查询时序库,如果告警规则量很大,对时序库的压力是很大的。当然,对性能的影响也没有那么夸张,把这个信息透传给大家,大家自行把握就好。