本节介绍如何查看多集群监控数据。
前提条件
您需要在 KubeSphere 企业版平台具有 platform-admin 角色。有关更多信息,请参阅用户和平台角色。
host 集群和需要监控的成员集群需要启用 Whizard 可观测中心。
说明 如果成员集群未启用 Whizard 可观测中心,Whizard 可观测中心将无法获取成员集群的数据。
操作步骤
以具有 platform-admin 角色的用户登录 KubeSphere 企业版 Web 控制台。
在页面右上角点击图标,选择 Whizard 可观测中心。
Whizard 可观测中心的概览页面显示所有集群的监控信息。
功能区 描述 已创建资源数量
显示当前平台管理的所有集群、节点、项目、容器组、部署、有状态副本集、守护进程集、任务、定时任务、卷、服务、应用路由的数量。
资源使用情况
显示当前平台管理的所有集群的所有节点的 CPU、内存、磁盘使用情况,以及可已创建容器组数量占可创建容器组最大数量的百分比。默认情况下每个节点最多可以创建 110 个容器组。
对于 CPU 和内存,将光标悬停在可查看已分配给容器和项目的资源预留和上限数量。
集群成员和集群角色
显示当前平台管理的所有集群的集群成员和集群角色数量。
全局告警
显示全局告警规则组产生的告警数量及最近的告警消息。此处显示的告警不包括集群和项目告警规则组产生的告警。全局告警规则组由平台管理员在 Whizard 可观测中心管理。
告警级别的类型包括提醒、警告、重要和紧急。
告警状态的类型包括:
验证中:监控指标满足预设的条件,但未满足预设的持续时间。
已触发:监控指标满足预设的条件,并且满足预设的持续时间。
资源用量排行
显示当前平台资源用量最多的集群、节点、项目和容器组。
点击下拉列表可选择对象类型和排序依据。
在列表上方点击/ 可按升序/降序排序。
点击查看更多可查看集群、节点、项目和容器组的资源用量详情。
容器组
显示当前平台管理的所有集群的各种类型容器组的数量。
容器组状态类型包括:
运行中:容器组已分配给某个节点,容器组中的所有容器都已被创建,至少有一个容器正在运行、启动或重启。
等待中:容组器已被系统接受,但有至少一个容器尚未创建也未运行。此状态下,容器组可能正在等待调度,或等待容器镜像下载完成。
已完成:容器组中的所有容器都成功终止(以 0 退出码终止),并且不再重启。
失败:容器组中的所有容器都已终止,并且至少有一个容器以非 0 退出码终止。
未知:系统无法获取容器组状态。出现这种状态通常是由于系统与容器组所在的主机通信失败。
容器组 QoS(服务质量)类型包括:
Guaranteed:容器组中的每个容器都具有内存上限、内存请求、CPU 上限、CPU 请求,并且内存上限等于内存请求,CPU 上限等于 CPU 请求。
Burstable:容器组中至少有一个容器不满足 Guaranteed 类型的要求。
BestEffort:容器组中的容器没有配置任何内存上限、内存请求、CPU 上限或CPU 请求。
容器组的 QoS 类型将决定容器组运行的优先级。当系统中资源不足以运行所有容器组时,系统优先保证运行 QoS 类型为 Guaranteed 的容器组,其次保证运行 QoS 类型为 Burstable 的容器组,最后保证运行 QoS 类型为 BestEffort 的容器组。
在左侧导航栏点击集群的名称,可查看集群的详细监控信息。
在页面右上角,点击选择集群,选择需要监控的集群。