OceanBase 集群状态监控,登录 V2.3.0 版本 OCP 后,在左导航栏单击大盘即可查看当前状态,主要包含:集群健康度、总体性能趋势、合并时间 TOP5、运维任务、巡检数据、机器使用情况这几种功能。大盘01.jpg

集群健康度

主要收集 OceanBase 集群实际状态,通过这里可以对平台所管理的所有 OceanBase 集群集群监控状况有一个大概的总览。

  • 如果发生内存使用率超过 70%、QTPS_RT 超过 50ms 时,健康度会显示为警告黄色;
  • 如果发生内存使用率超过 80%、QTPS_RT超过 100ms 时,健康度会显示为异常红色。

image.png

总体性能趋势

主要展示管理的 OceanBase 集群整体 QTPS 及 RT,采集粒度间隔为 1 分钟,范围最大可选择一个月,最小可选择 5 分钟内。可通过此功能看到所有管理 OceanBase 集群的整体读写压力。

image.png

合并时间 TOP5

主要展示所管理 OceanBase 集群中合并时间排行,合并时间从左到右递减,可作为集群间合并相对快慢参考。

image.png

运维任务

主要展示目前 OCP 中 当**前进行中任务、最近七天总计执行任务、最近七天任务失败** 统计个数,可反映出平台近期运维任务执行频度,以及平台任务执行成功率。

image.png

巡检数据

主要展示 OCP 中后台所执行的巡检数据统计,仅供 OCP 管理员参考,可反映出后台巡检任务执行成功率。

image.png

机器使用情况

主要展示各 OceanBase 集群机器使用情况,不包括平台剩余空闲资源,可反映出平台中各 OceanBase 集群物理机使用情况,供 DBA 参考。

image.png