Alertmanager 配置

通常没有必要直接编辑 Alertmanager 的自定义资源。对于大多数使用场景,你只需要编辑接收器和路由来配置通知。

当接收器和路由被更新时,监控应用程序将自动更新 Alertmanager 的自定义资源,使这些变化一致。

本节假设你已经熟悉监控组件如何协同工作。关于 Alertmanager 的更多信息,请参见本节。

关于 Alertmanager 自定义资源

默认情况下,Rancher 监控将一个单一的 Alertmanager 部署到一个集群上,该集群使用默认的 Alertmanager Config Secret。

如果你想利用 Rancher UI 表单中没有暴露的高级选项,例如创建一个超过两层的路由树结构,你可能需要编辑 Alertmanager 自定义资源。

也可以在一个集群中创建一个以上的 Alertmanager,如果你想实现命名空间范围的监控,这是很有用的。在这种情况下,你应该使用相同的底层 Alertmanager Config Secret 来管理 Alertmanager 的自定义资源。

深度嵌套的路由

虽然 Rancher UI 只支持两层深度的路由树,但你可以通过编辑 Alertmanager YAML 来配置更多深度嵌套的路由结构。

多个 Alertmanager Replicas

作为 chart 部署选项的一部分,你可以选择增加部署在集群上的 Alertmanager 的副本数量。这些副本都可以使用相同的底层 Alertmanager Config Secret 来管理。

这个 Secret 应该在任何时候被更新或修改:

  • 添加新的通知器或接收器
  • 更改应该发送给特定通知者或接收者的告警
  • 改变发送告警的组别

默认情况下,你可以选择提供一个现有的 Alertmanager Config Secret(即 cattle-monitoring-system 命名空间中的任何 Secret),或者允许 Rancher Monitoring 在你的集群中部署一个默认的 Alertmanager Config Secret。

默认情况下,Rancher 创建的 Alertmanager Config Secret 在升级或卸载 rancher-monitoring chart 时将不会被修改或删除。这个限制可以防止用户在 chart 上执行操作时丢失或改写他们的告警配置。

关于在 Alertmanager Config Secret 中可以指定哪些字段的更多信息,请看Prometheus Alertmanager 文档.

Alertmanager 配置文件的完整规格以及它所接收的内容可以在这里查看。