Milvus 监控指标

Milvus 会生成关于系统运行状态的详细时序 metrics。你可以通过 PrometheusGrafana 或任何可视化工具展现以下指标:

  • Milvus 性能指标
  • 系统运行指标:CPU/GPU 使用状况,网络、磁盘读取等指标。
  • 硬件存储指标:数据大小,数据文件及存储情况等指标。

Milvus 性能指标

指标说明
Insert per Second每秒钟插入的向量数量(实时显示)。
Queries per Minute每分钟运行的查询数量(实时显示)。
Query Time per Vector单条向量查询时间 = 查询使用时间 / 向量数量
Query Service Level查询服务级别 = 一定时间阈值内的查询数量/总查询数量
一般建议设置 3 个时间阈值来跟踪查询服务级别。
UptimeMilvus 服务器正常运行的时长(分钟)。

系统运行指标

指标说明
GPU UtilizationGPU 利用率(%)。
GPU Memory UsageMilvus 当前使用的显存量 (GB)。
CPU UtilizationCPU 利用率(%)= 服务器任务执行时间 / 服务器总运行时间
Memory UsageMilvus 当前使用的内存量(GB)。
Cache Utilization缓存利用率(%)。
Network IO网口的读写速度(GB/s)。
Disk Read Speed磁盘读取速度(GB/s)。
Disk Write Speed磁盘写入速度(GB/s)。

硬件存储指标

指标说明
Data SizeMilvus 所存数据总量(GB)。
Total FileMilvus 所存数据文件总个数。