告警设置
告警设置
概念
这里用户配置平台告警
前提条件
需要设置告警的集群应该先在其 基本信息 页里开启监控告警
新建告警设置
- 登录 TKEStack
- 切换至【平台管理】控制台,选择 【监控&告警】下的【告警设置】,查看“告警设置”列表
- 选择相应【集群】,点击【新建】按钮,如下图所示:
- 在“新建策略”页面填写告警策略信息,如下图所示:
- 告警策略名称: 输入告警策略名称,最长60字符
- 策略类型: 选择告警策略应用类型
- 集群: 集群监控告警
- Pod: Pod 监控告警
- 告警对象: 选择 Pod 相关的告警对象,支持对 namespace 下不同的 deployment、stateful和daemonset 进行监控报警
- 按工作负载选择: 选择 namespace 下的某个工作负载
- 全部选择: 不区分 namespace,全部监控
- 告警对象: 选择 Pod 相关的告警对象,支持对 namespace 下不同的 deployment、stateful和daemonset 进行监控报警
- 节点: 节点监控告警
- 统计周期: 选择数据采集周期,支持1、2、3、4、5分钟
- 指标: 选择告警指标,支持对监测值与指标值进行【大于/小于】比较,选择结果持续周期,如下图。指标具体含义可参考:[监控&告警指标含义](../../../FAQ/Platform/alert&monitor-metrics.md)
- 接收组: 选择接收组,当出现满足条件当报警信息时,向组内人员发送消息。接收组需要先在 用户管理 创建
- 通知方式: 选择通知渠道和消息模版。通知渠道 和 消息模版需要先在 通知设置 创建
- 添加通知方式 :如需要添加多种通知方式,点击该按钮
- 单击【提交】按钮
复制告警设置
- 登录 TKEStack
- 切换至【平台管理】控制台,选择 【监控&告警】下的【告警设置】,查看“告警设置”列表
- 选择相应【集群】,点击告警设置列表最右侧的【复制】按钮,如下图所示:
- 在“复制策略”页面,编辑告警策略信息
- 单击【提交】按钮
编辑告警设置
- 登录 TKEStack
- 切换至【平台管理】控制台,选择 【监控&告警】下的【告警设置】,查看“告警设置”列表
- 选择相应【集群】,点击【告警名称】,如下图所示:
- 在“告警策略详情”页面,单击【基本信息】右侧的【编辑】按钮,如下图所示:
- 在“更新策略”页面,编辑策略信息
- 单击【提交】按钮
删除告警设置
- 登录 TKEStack
- 切换至【平台管理】控制台,选择 【监控&告警】下的【告警设置】,查看“告警设置”列表
- 选择相应【集群】,点击列表最右侧的【删除】按钮,如下图所示:
- 在弹出的删除告警窗口,单击【确定】按钮
批量删除告警设置
- 登录 TKEStack
- 切换至【平台管理】控制台,选择 【监控&告警】下的【告警设置】,查看“告警设置”列表
- 选择相应【集群】,选择多个告警策略,单击告警设置下方的【删除】按钮。如下图所示:
- 在弹出的删除告警窗口,单击【确定】按钮