在 V2.3.0 版本 OCP 完成告警通道配置后,可对告警订阅进行设置。
操作步骤
- 登录 OCP。
- 单击左导航栏告警>告警订阅。
- 在默认的订阅列表界面可查看已订阅信息,并可对已有订阅信息进行查看、编辑、删除操作。
- 单击新建订阅,可进入新建订阅界面。
- 在订阅集群下拉列表中选择需要订阅的目标集群 。
- 勾选告警项组,这里告警项组是 OCP 默认配置的不同角色关注的告警项集合,一般系统管理员或数据库管理员选择dba即可。OCP 有 4 个初始化分组,系统内建分组可以编辑,无法删除。
分组名称 | 分组描述 |
dba | 数据库管理员关注的告警项 |
dev | 开发者关注的告警项 |
oms | OMS应用管理员关注的告警项 |
backup | 备份恢复管理员关注的告警项 |
- 在告警方式列表中针对不同的告警登记,选择不同的告警通道即可,推荐停服、严重两个级别勾选默认、短信、电话通道,其他级别只勾选钉钉或短信通道即可。
不同告警等级列表如下:
级别 | 英文含义 | 中文含义 | 颜色 | 告警级别说明 |
1 | Down | 停服 | 紫 | 完全不可用,需要立即介入修复,如 OB服务启动失败,此类告警建议勾选全部告警通道,保证所有关注者道都能收到。 |
2 | Critical | 严重 | 红 | 系统可用性下降,需要紧急修复,避免完全不可用, 如 机器内存使用率大于90%持续3分钟,此类告警建议勾选钉钉、短信通道,保证管理者用户能收到消息。 |
3 | Alert | 警告 | 橙 | 系统仍然可用,但是即将达到不可用状态,需要采取措施防止可用性下降, 如 OB租户连接数大于上限的80%,此类告警建议勾选钉钉或短信,引起订阅者关注即可。 |
4 | Caution | 注意 | 蓝 | 根据趋势判断,系统关键性能指标正在下降,但是还没达到触发警告的程度,此时可以通过排查发现潜在的问题,避免警告产生(保留类型,目前尚未有匹配的告警项),此类告警建议勾选钉钉即可。 |
5 | Info | 提醒 | 绿 | 操作提醒,本质上不是告警,通常是管理员执行重要操作,如 管理员执行集群下线操作,此类告警一般勾选默认/钉钉通道即可。 |
- 选择完成后单击确定按钮,即订阅成功。
- 完成订阅后,可以在告警订阅**>个人接受设置**中,对不同告警通道的告警接受频率进行设置。
- 接受告警通知:此开关为消息接受总开关,关闭后订阅者将接收不到任何通道的告警消息,一般用作告警异常时暂时关闭告警接受消息来使用。
- 接受恢复通知:默认 OCP 告警项发出告警后,当触发告警条件解除后,会默认发送一条告警恢复通知,关闭此开关后,订阅者将不会受到告警恢复通知;
- 多个通道接受限制:可通过下拉列表中的不超过选项,配置每小时/每天接受告警次数,如某些提醒类告警发送频繁,可对此级别告警项告警通道进行限制配置。