V2.3.0 版本 OCP 对告警消息的管理主要包括:告警事件、告警同志、告警屏蔽和日志过滤。

  • 告警事件:当某集群处于异常状态,导致用户收到大量告警消息时,如需要对其中部分指定告警项进行查看和统计,可通过告警事件进行管理。
  • 告警通知:为您提供 90 天内的通知记录查看,超过 90 天的通知记录将会自动归档。
  • 告警屏蔽:实际生产过程中,当集群出现异常引发告警时,某些导致告警的已知问题可能需要较长时间才能恢复解决,为避免消息打扰,这时可使用告警界面中“告警屏蔽”页签中屏蔽告警的功能,对具体告警项进行短时间屏蔽。
  • 日志过滤:由于 OB 为分布式数据库,故存在三类不同的类型日志,包括 election 选举日志、 rootservice 管控服务日志、 observer 运行日志。OB 日志告警不基于告警规则触发,实现原理是在 OB 服务器节点上监视三种日志,发现 ERROR 级别的日志则触发告警。由于物理机环境及不同节点上系统环境千差万别,如果用户发现有 ERROR 级别日志误报的情况,可以在此日志过**滤**页面配置日志过滤规则。

告警事件

  1. 登录 OCP。
  2. 单击左导航栏告警>告警事件,单击展开。

可看到这里支持集群组、集群、租户、服务器、告警状态、告警等级、起止时间维度的筛选,其中:告警状态除了全部外还包括:已恢复、告警中、已屏蔽、已抑制四个状态;从搜索框中可输入告警内容关键字进行结果筛选。展开告警信息.jpg

告警通知

  1. 登录 OCP。
  2. 单击左导航栏告警>告警通知,单击展开

可看到支持告警等级、告警项、接收人、起止时间维度的筛选,同样这里也支持搜索告警内容关键字筛选告警通知记录。

展开告警通知.jpg

告警屏蔽

  1. 登录 OCP。
  2. 单击左导航栏告警>告警通知,单击新建屏蔽条件新建屏蔽条件.jpg
  3. 填写屏蔽条件内容:
  • 集群:选择目标集群。
  • 屏蔽范围:栏选择要屏蔽的告警范围,目前可选择集群内全部、某租户、某服务器三个范围。
  • 屏蔽项:选择要屏蔽的告警项,支持多选。

image.png

  1. 单击确定即可生成屏蔽规则;屏蔽条件新建后即时生效,已创建的屏蔽记录可在图三告警屏蔽界面查询到,并支持对已有屏蔽记录进行“编辑”和“删除”。

说明:

为避免屏蔽记录复用及历史屏蔽记录查询,已失效的屏蔽记录不会自行删除。

日志过滤

  1. 登录 OCP。
  2. 单击左导航栏告警>日志过滤,单击添加过滤关键字

    image.png

  3. 填写过滤关键字信息:

  • 集群:选择目标集群(这里可选择全部集群)。
  • 服务器类型:election、rootservice、observer 三选一。
  • 关键字:输入需要过滤的关键字(区分大小写及空格)。

image.png

  1. 单击确定即可创建日志关键字过滤规则,规则创建后即时生效。在日志过滤界面可对已有屏蔽条件进行修改过期时间删除操作。