集群历史性能监控功能,主要通过 V2.3.0 版本的 OCP 左导航栏 监控>**OB 数据趋势** 界面进行查询。在该界面中按监控范围选择,可监控集群组维度、集群维度、租户维度和服务器维度;按集群实时性能监控选择,可监控集群组维度和集群维度。

数据趋势.jpg

监控范围选择

集群日常维护中如果产生集群、ZONE、服务器等不同维度的故障,需选择对应的集群组、集群、ZONE、服务器进行监控数据搜索,不同维度下单击 搜索 按钮后呈现出的监控界面不同。

说明:集群组即为某个业务下不同 OceanBase 集群的一个逻辑集合,不同 OceanBase 集群间的资源是相互隔离的。

image.png

集群组维度

此维度监控主要用于监控某个业务下多个 OceanBase 集群在指定时间范围内的整体性能趋势。页面主要展示信息如下:

  1. 集群组 下拉列表区域中选择目标集群组,并选择对应的 时间 范围,单击 搜索,即可得到集群组维度对应时间范围内监控展示。

趋势.jpg

  1. 页面左侧区域展示了当前集群组所有 OceanBase 集群中 磁盘最大已用、磁盘利用率、CPU利用率、内存利用率以及所有集群中主机统计。
  2. 下图展示监控图为所有集群在目标时间范围内的 QPS、TPS、QPS RT、TPS RT 指标,默认 OCP 配置此处展示数据范围最大为 7 天。

趋势02.jpg

  1. 下方区域展示了集群组中不同集群列表,以及不同集群中 ZONE 个数、RootServerIP 地址、集群状态、QPS、QPS RT、TPS、TPS RT、Active Mem(活跃内存百分比),用户可以单击入具体某个集群维度的历史性能监控界面。

注意:图中 集群状态 指标为某个集群的 OCP 管控定义状态,如集群处于 OCP 运维任务执行状态,则状态显示为 Operating 。

image.png

集群维度和租户维度

此维度监控主要用于监控指定 OceanBase 集群在指定时间范围内的性能趋势。页面主要展示信息如下:

  1. 在下图两个下拉列表中分别选择目标集群组、集群和时间范围,单击 搜索 按钮,即可得到集群维度对应时间范围内监控展示。

趋势.jpg

  1. 其中左侧区域除了同集群组维度相同的 磁盘最大已用、磁盘利用率、CPU利用率、内存利用率 四个指标外,增加了 集群模型、表数量、合并/冻结、合并时间xx分钟 四个展示列。

趋势05.jpg

说明

  • 集群模型 为目标 OceanBase 集群 ZONE 中节点分布统计。
  • 表数量合并/冻结 暂无具体意义。
  • 合并时间指标为三个 ZONE 各自合并耗时之和,整体集群合并时间需结合集群是否为轮转合并模式进行计算(轮转合并集群合并时间即为图中统计时间,非轮转合并集群合并时间为三个 ZONE 中合并最长耗时 ZONE 的时间)。
  1. 下图为集群最近三次所有 ZONE 合并时间统计图,统计图标数字分别代表三天不同的合并版本号。

趋势06.jpg

  1. 下图展示了集群中不同 ZONE 的 ID 名称、状态、QPS、QPS RT、TPS、TPS RT、入流量、出流量、CPU、LOAD 指标当前的瞬时值,用户可以单击 ZONE ID 列中具体 ZONE 名称,进入具体某个ZONE维度的历史性能监控界面。趋势-7.jpg
  2. 进入新的页面后,通过鼠标滚轴或右侧边滚动条拉动界面到下方,可看到目标集群下所有服务器不同性能指标的监控展示。

image.png

  1. 单击 租户,可进入到OB集群中租户维度列表,列表中包含了 租户名、primary_zone、QPS、QPS RT、TPS、TPS RT、IO写次数、IO读次数、CPU、磁盘、内存 指标,均为当前瞬时值。其中 sys 租户为 OB 系统租户。

image.png7. 单击 租户名 列表中的租户名,可进入 OB 集群租户级性能监控分页,如下图所示:

image.png

服务器维度

此维度监控主要用于监控 OB 集群中具体某个服务器节点在指定时间范围内的性能趋势。如下图所示:

image.png

集群实时性能监控

集群实时性能监控功能,主要通过 OCP 左导航栏 监控 > OB 实时 界面进行查询。

  1. 此界面中范围选择类似历史性能趋势界面,提供集群组和集群两个下拉列表供选择。
  2. 下方默认展示 OCP 中全部集群组的 集群组名称、QPS、QPS RT、TPS、TPS RT、NET IN入流量、NET OUT出流量、CPU、磁盘、内存 指标,所有监控数据每秒采集一次,界面中数据两秒刷新一次。

注意:该界面中 磁盘 指标为当前集群组中所有节点数据盘平均水位,由于 OceanBase 集群为预占磁盘部署,故此指标水位日常显示均在 75% 以上。

OB实时.jpg集群组 单击集群组名称,可进入到OB集群组性能实时监控界面。

  1. 选择具体 集群组集群 后单击 搜索,也可进入实时性能数据页面。
  2. 下图以时间(每一列为某一秒)为横轴,QPS、TPS、TPS RT、QPS RT 四个指标为纵轴,展示该集群组下所有 OB 集群的每秒读写次数及每秒平均 RT。

性能实时数据1.jpg

  1. 下图为集群组两分钟内 QPS/QPS RT及TPS/TPS RT 变化趋势图,横轴均为时间,左侧纵轴均为 QPS/TPS 次数,右侧纵轴均为平均 RT。

性能实时数据2.jpg

  1. 下图为该集群组下所有集群当前实时性能列表,指标与实时界面默认展示指标相同,采集和刷新频率也分别为一秒一次和两秒一次。

性能实时数据3.jpg

  1. 单击具体集群名称,可进入到具体 OB 集群性能实时监控界面,同样从最上方选择对应集群组和集群后单击查询,也可进入到此界面。

image.png

  1. 该界面上方两大区域与集群组界面展示一致,区别仅在于展示维度是某个具体 OB 集群,通过鼠标滚轴或右侧边滚动条拉动界面到下方。

租户服务器.jpg

  • 租户:

为 OceanBase 集群中所有租户实时性能数据,指标包括 租户名、**QPS、TPS、QPS RT、TPS RT、IO 读次数、IO 写次数、CPU、内存、磁盘**。

注意

  • 这里某个租户的 磁盘 指标表示租户实际数据占用磁盘大小;
  • 从此区域选择具体某个租户名称,将进入OceanBase 集群维度性能趋势监控界面,用户可按租户名称找到具体租户历史性能监控数据。
  • 服务器:

下方区域为 OceanBase 集群中所有服务器实时性能数据,指标包括 IP服务器 IP 地址、QPS、TPS、**QPS RT、**TPS RT、入流量、出流量、LOAD、CPU、内存、磁盘

注意

  • 这里某台服务器的 磁盘 指标为该服务器数据盘实际水位,由于 OB 为预占磁盘部署,故此指标水位日常显示均在 75% 以上;
  • 从此区域选择具体某个服务器的 IP 链接(蓝色字体),将进入 OceanBase 集群服务器维度性能趋势监控界面,用户可按 IP 地址查询到该服务器历史时间其他不同维度的性能监控数据。