告警

kubeprober 对集群执行诊断,将诊断项的结果分为 PASS, WARN, ERROR 三中状态,系统支持将 ERROR 的诊断项告警出来,当前支持钉钉。
对于告警也是使用 CRD 来实现,在 probe-master 所在集群中创建一个 Alert 的 CRD 即可。

  1. apiVersion: kubeprober.erda.cloud/v1
  2. kind: Alert
  3. metadata:
  4. name: dingding
  5. namespace: default
  6. spec:
  7. address: https://oapi.dingtalk.com
  8. token: xxxxxxxx
  9. sign: xxxxxxxx

Token 跟 Sign 分别对应钉钉机器人的 Token 跟 签名。

创建钉钉机器人

集群人创建入口: 钉钉群 —> 【群设置】 —> 【智能群助手】—> 【添加机器人】—> 【自定义】
勾选加签

告警 - 图1

告警 - 图2

告警效果

告警 - 图3