本节介绍如何使用“WhizardTelemetry 告警管理”扩展组件。

    WhizardTelemetry 告警管理基于 KubeSphere 采集的监控数据,可针对不同资源类型和监控指标,提供平台、集群及项目视角的告警及告警规则管理功能。

    安装“WhizardTelemetry 告警管理”扩展组件后,集群和项目左侧导航栏的监控告警菜单下将显⽰告警规则组选项。

    注意
    • WhizardTelemetry 告警管理依赖 WhizardTelemetry 平台服务和 WhizardTelemetry 监控,因此在安装 WhizardTelemetry 告警管理之前必须先安装 WhizardTelemetry 平台服务和 WhizardTelemetry 监控两个扩展组件,否则告警相关功能无法正常使用!

    • 为了及时收到系统告警消息,建议同时安装 WhizardTelemetry 通知管理扩展组件。

    配置说明:

    • WhizardTelemetry 监控扩展组件未启用 Whizard 可观测中心时:

      1. 安装 WhizardTelemetry 告警管理扩展组件时,保持 global.rules.distributionMode 为 Member。

      2. 若使用 WhizardTelemetry 通知管理扩展组件发送告警消息,需将 WhizardTelemetry 告警管理的 agent.ruler.alertmanagersUrl 配置为 WhizardTelemetry 通知管理的 alertmanager-proxy 服务,该服务安装在 host 集群,以 NodePort 形式(默认 31093)暴露。

        1. global:
        2. rules:
        3. distributionMode: Member
        4. agent:
        5. ruler:
        6. alertmanagersUrl:
        7. - 'http://<host>:<port>'
    • WhizardTelemetry 监控扩展组件已启用 Whizard 可观测中心时:

      1. 安装 WhizardTelemetry 告警管理扩展组件时,保持 global.rules.distributionMode 为 None。

      2. 若使用 WhizardTelemetry 通知管理扩展组件发送告警消息,需将 WhizardTelemetry 告警管理的 extension.ruler.alertmanagersUrl 配置为 WhizardTelemetry 通知管理的 alertmanager 服务(按如下配置即可)。

        1. global:
        2. rules:
        3. distributionMode: None
        4. extension:
        5. ruler:
        6. alertmanagersUrl:
        7. - 'dnssrv+http://whizard-notification-alertmanager-headless.kubesphere-monitoring-system.svc:9093'