v2.2.4 或更新版本可用

您可以通过 Rancher 和 Prometheus 的集成,监控集群节点、Kubernetes 组件或工作负载的状态。

如需了解更多关于 Prometheus 的信息,请参考Prometheus 的工作原理

监控范围

Prometheus 监控可以应用于 Rancher 集群层级和 Rancher 项目层级。Rancher 为每一个启用了监控功能的集群和项目都部署了一个对应的 Prometheus Server。

  • 集群监控允许用户查看 Kubernetes 集群的健康状况。Prometheus 从以下的集群组件中收集健康数据,用户可以通过 Rancher 用户界面的图表查看集群的健康状况。

  • 项目监控允许用户查看项目内 Pod 的运行状态。项目级别的 Prometheus 可以从通过 HTTP(S)协议采集,项目中部署的工作负载的自定义指标。

提示: 如果集群开启了集群监控,您不需要开启项目监控也可以在 Rancher UI 中查看工作负载的资源使用相关的指标,如 CPU 和内存等。但是项目管理员和项目成员无法访问 Grafana 查看指标,并且也无法采集自定义指标。

配置项目监控的权限

只有管理员集群所有者或集群成员项目所有者可以配置项目层级的监控。项目成员可以查看监控参数,不可以修改监控参数。

开启项目监控

注意: 如果需要查看 Pod 资源使用相关的指标,您需要先开启集群监控。否则您只能通过项目监控采集自定义指标。

  1. 打开需要启用项目监控功能的项目。

  2. 在导航栏选择工具 > 监控

  3. 选择 启用,控制台上会出现Prometheus 配置选项,输入您需要配置的监控参数。

  4. 单击保存,保存修改后的参数配置。

项目层级监控资源要求

容器CPU 资源需求内存资源需求CPU 资源限制内存限制是否可以修改
Prometheus750m750Mi1000m1000Mi
Grafana100m100Mi200m200Mi

**结果:**完成监控资源配置以后,Rancher 会把一个叫做project-monitoring的项目层级监控,以应用商店应用的形式添加到了项目中。当这个应用的状态变成了active ,您可以通过 Rancher UI 查看项目的监控指标,或者直接从Grafana查看项目的监控指标。

Grafana 实例的默认用户名和密码为 “admin/admin”。然而,Grafana 仪表板是通过 Rancher 认证代理提供服务的,因此只有当前通过认证进入 Rancher 服务器的用户才能访问 Grafana 仪表板。

项目监控指标

在激活了项目监控后,在部署工作负载的页面,您可以配置自定义指标端点,从而使项目监控可以采集到自定义指标。当然,您可以通过部署任何 Prometheus exporters,并在 Rancher 中配置相应的自定义端点,从而监控您的服务。

示例: 项目中有一个命名空间叫 redis-app ,这个命名空间中部署了一个 Redis 应用。您可以通过部署 Redis exporter 监控这个应用。开启了项目监控以后,您可以编辑 Redis exporter 工作负载,配置高级选项 -> 自定义参数。输入暴露指标的端口路径,然后选择协议

访问项目层级的 Grafana 实例需要执行以下步骤:

  1. 全局视图找到到已经开启监控的集群。

  2. 打开这个集群中已经开启监控的项目。

  3. 打开项目视图,单击应用商店

  4. 打开project-monitoring应用。

  5. project-monitoring里面,有两个以/index.html结尾的链接,分别连接了 Prometheus 实例和 Grafana 实例。单击 Grafana 实例的链接,会打开一个新的页面,里面有集群的监控参数。

  6. 您会自动跳转到 Grafana UI。如果需要以管理员身份登录 Grafana,您需要在 Grafana 页面手动登录。默认的 Grafana 管理员的用户名和密码都是admin。为了保证 Grafana 实例的安全,建议您在登入后,先修改密码,然后再开始使用 Grafana 实例。

结果: 您通过 Grafana 实例登录 Grafana,登录后,您可以查看通过Grafana Provisioning 机制导入的,已经设置好的的 Grafana 仪表盘。如果您需要修改或创建自己的仪表盘,您需要先登录 Grafana。我们建议您先复制原有的 Grafana 仪表盘,通过它创建一个副本,再通过修改副本的参数,达到创建自己的仪表盘的目的。