使用 Grafana 展示监控指标

启动并配置 Grafana

  1. 运行 Grafana:
  1. docker run -i -p 3000:3000 grafana/grafana
  1. 在浏览器中打开 http://<提供 Grafana 服务的主机 IP>:3000 网址,并登录 Grafana 用户交互页面。

Grafana 的默认用户名和密码都是 admin。你也可以在此创建新的 Grafana 账号。

  1. 将 Prometheus 添加为数据源
  2. 在 Grafana 用户交互页面中,点击 Configuration > Data Sources > Prometheus,然后设置以下数据源属性:

    名称
    NamePrometheus
    DefaultTrue
    URLhttp://<提供 Prometheus 服务的主机 IP>:9090
    AccessBrowser
  3. 下载 Grafana 配置文件

  4. 将配置文件导入 Grafana

    prometheus.png

监控指标概述

你可以通过 Milvus 提供的 Grafana 配置文件 配置展示在 Grafana Dashboard 的以下各种指标:

指标类型说明
Milvus 性能指标关于 Milvus 性能状况的指标。
系统运行指标CPU/GPU 使用状况,网络、磁盘读取等指标。
硬件存储指标数据大小,数据文件及存储情况等指标。

Milvus 性能指标

指标说明
Insert per Second每秒钟插入的向量数量(实时显示)。
Queries per Minute每分钟运行的查询数量(实时显示)。
Query Time per Vector单条向量查询时间 = 查询使用时间 / 向量数量
Query Service Level查询服务级别 = 一定时间阈值内的查询数量/总查询数量
一般建议设置 3 个时间阈值来跟踪查询服务级别。
UptimeMilvus 服务器正常运行的时长(分钟)。

系统运行指标

指标说明
GPU UtilizationGPU 利用率(%)。
GPU Memory UsageMilvus 当前使用的显存量 (GB)。
CPU UtilizationCPU 利用率(%)= 服务器任务执行时间 / 服务器总运行时间
Memory UsageMilvus 当前使用的内存量(GB)。
Cache Utilization缓存利用率(%)。
Network IO网口的读写速度(GB/s)。
Disk Read Speed磁盘读取速度(GB/s)。
Disk Write Speed磁盘写入速度(GB/s)。

硬件存储指标

指标说明
Data SizeMilvus 所存数据总量(GB)。
Total FileMilvus 所存数据文件总个数。