V2.3.0 版本 OCP 对告警消息的管理主要包括:告警事件、告警同志、告警屏蔽和日志过滤。
- 告警事件:当某集群处于异常状态,导致用户收到大量告警消息时,如需要对其中部分指定告警项进行查看和统计,可通过告警事件进行管理。
- 告警通知:为您提供 90 天内的通知记录查看,超过 90 天的通知记录将会自动归档。
- 告警屏蔽:实际生产过程中,当集群出现异常引发告警时,某些导致告警的已知问题可能需要较长时间才能恢复解决,为避免消息打扰,这时可使用告警界面中“告警屏蔽”页签中屏蔽告警的功能,对具体告警项进行短时间屏蔽。
- 日志过滤:由于 OB 为分布式数据库,故存在三类不同的类型日志,包括 election 选举日志、 rootservice 管控服务日志、 observer 运行日志。OB 日志告警不基于告警规则触发,实现原理是在 OB 服务器节点上监视三种日志,发现 ERROR 级别的日志则触发告警。由于物理机环境及不同节点上系统环境千差万别,如果用户发现有 ERROR 级别日志误报的情况,可以在此日志过**滤**页面配置日志过滤规则。
告警事件
- 登录 OCP。
- 单击左导航栏告警>告警事件,单击展开。
可看到这里支持集群组、集群、租户、服务器、告警状态、告警等级、起止时间维度的筛选,其中:告警状态除了全部外还包括:已恢复、告警中、已屏蔽、已抑制四个状态;从搜索框中可输入告警内容关键字进行结果筛选。
告警通知
- 登录 OCP。
- 单击左导航栏告警>告警通知,单击展开。
可看到支持告警等级、告警项、接收人、起止时间维度的筛选,同样这里也支持搜索告警内容关键字筛选告警通知记录。
告警屏蔽
- 登录 OCP。
- 单击左导航栏告警>告警通知,单击新建屏蔽条件。
- 填写屏蔽条件内容:
- 集群:选择目标集群。
- 屏蔽范围:栏选择要屏蔽的告警范围,目前可选择集群内全部、某租户、某服务器三个范围。
- 屏蔽项:选择要屏蔽的告警项,支持多选。
- 单击确定即可生成屏蔽规则;屏蔽条件新建后即时生效,已创建的屏蔽记录可在图三告警屏蔽界面查询到,并支持对已有屏蔽记录进行“编辑”和“删除”。
说明:
为避免屏蔽记录复用及历史屏蔽记录查询,已失效的屏蔽记录不会自行删除。
日志过滤
- 登录 OCP。
单击左导航栏告警>日志过滤,单击添加过滤关键字。
填写过滤关键字信息:
- 集群:选择目标集群(这里可选择全部集群)。
- 服务器类型:election、rootservice、observer 三选一。
- 关键字:输入需要过滤的关键字(区分大小写及空格)。
- 单击确定即可创建日志关键字过滤规则,规则创建后即时生效。在日志过滤界面可对已有屏蔽条件进行修改过期时间和删除操作。