OCP 的集群概览和总览页面分别展示了 OceanBase 集群的状态监控信息。
前提条件
登录前请确认您具备集群的管理权限或只读权限,否则无法查看集群概览数据。
背景信息
不同 OCP 版本的操作界面可能不同,本节以 OCP V2.4.4 版本为例提供操作指导,OCP 其他版本的操作请参考对应版本的《OCP 用户指南》文档。
其中,在 OCP V2.3.0 版本中,主要通过大盘页面来查看 OceanBase 集群的状态监控信息。
操作步骤
登录 OCP 后即进入 集群概览 页面。
集群概**览** 页面展示了当前登录用户下的所有 OceanBase 集群。
集群的以下状态信息:
集群合并时间 Top5
以柱状图的形式展示了最近三天内合并时间平均值从大到小排序最大的 5 个集群。合并操作(Major freeze)是将动静态数据做归并,会比较费时。当转储产生的增量数据积累到一定程度时,通过 Major freeze 实现大版本的合并。
如果最近三天内没有集群合并,则此处为空。
机器资源
按照 IDC 展示了机房里的机器总数和已经部署了 OBServer 的机器数量,可以为集群扩容提供参考。
资源水位
展示了集群的名称、主备角色、租户数量、每个集群总的资源单位(Resource Unit)和已分配的资源单位情况,包括已分配的 CPU 的百分比、已分配内存的百分比、已使用磁盘空间和总磁盘空间大小。
集群列表
展示了各集群的集群名、集群 ID、版本、部署模式(包括每个 Zone 所在的 Region,有多少台 OBServer 等)、集群状态、创建时间和告警统计信息等。
对于主备库集群,默认只显示主集群的信息,单击左侧的+图标可以查看备集群的信息。
在 集群列表 区域,单击某个集群名,进入该集群的 总览 页面。
集群总览 页面展示了当前指定 OceanBase 集群的以下状态信息:
集群概要信息
主要展示当前集群的集群类型、 OceanBase 数据库版本号、Region 数量、Zone 数量、机器数量、分区数、租户数量、集群的创建者以及 ConfigUrl 等信息。
资源水位
主要展示当前集群中可用系统资源的百分比,即 CPU 剩余、内存剩余和磁盘剩余的百分比。
告警概览
主要展示与当前集群相关的所有告警信息,并且这些告警信息按照告警的严重程度进行了分类展示。
目前主要有停服、严重、警告、注意、提醒等5类告警。
系统默认显示当前存在的各种告警,您可以根据业务需要,查看最近 24 小时、最近一周或最近 30 天的告警信息。
最近 7 天的系统事件
主要展示当前集群与总控服务相关的事件详情,并且所有事件均按照事件发生的时间进行了排序。
每一条系统事件展示的信息主要包括该事件的事件名称、所属模块、开始时间、事件详情和事件说明。
对于常见的事件,系统会显示事件详情和事件说明;对于不常见的事件,事件详情和说明会无任何内容。
Zone 列表
主要展示当前集群中的各个 Zone 的基本信息,包括 Zone 名称、所属 Region、所在机房以及 RootServer 地址和状态信息,同时还提供了 Zone 级别的运维操作入口,包括添加 OBServer、重启某个 Zone 下所有节点的 OBServer 进程、停止某个 Zone下所有节点的 OBServer 进程以及删除某个 Zone 下的所有节点。
OBServer 列表
主要展示当前集群中的各个 OBServer 的基本信息,包括 IP地址、OBServer 使用的端口、所在机房、所属 Zone、机型以及剩余的 CPU、内存和磁盘资源信息等。
此外,OCP 还为当前集群中的每个 OBServer 提供了常见的运维操作入口,包括重启、启动、停止、替换以及删除 OBServer 等,方便您进行基本运维操作。