配置 Milvus 以用于生产环境

在生产环节中使用 Milvus 之前,请您检查以下设置,以保证 Milvus 可以保证数据安全并达到一定的性能要求。

数据安全

使用 MySQL 作为元数据管理服务

详细信息请参考数据管理

将数据存储目录移动到 tmp 以外的目录

把服务段配置文件中的以下目录移动到 tmp 以外的目录

  • storage_config
  • primary_path
  • wal_config
  • wal_path
  • log_path

性能调优

请检查以下参数的设置以确保性能:

Milvus 服务端配置文件参数设置

  • preload_table: 建议在内存允许的情况下尽可能多地加载 collection。这样在每次重启服务端之后,数据都会先载入到 Milvus 中,可以解决第一次搜索耗时很长的问题。
  • buffer_size: 影响插入性能。建议插入数据量为 buffer_size 的一半。
  • insert_buffer_size
    • (如果 WAL 开启了)建议 insert_buffer_size 大于 wal_buffer_size 的一半 且插入数据量小于 wal_buffer_size的一半。
    • (如果 WAL 没有开启)建议插入的数据量小于 insert_buffer_size
  • cpu_cache_capacity:建议在内存允许的情况下尽可能调大。这样有助于确保数据全部在内存中,减少内存和磁盘的数据交换,从而提高查询性能。
  • use_blas_threhold: 影响的不同查询批量使用的距离计算函数。nq < use_blas_threshold 时使用 CPU 指令集进行查询,否则使用的是 OpenBLAS 来计算距离。大多数场景下,使用 CPU 指令集进行查询的性能会更好。

Milvus 客户端参数设置

  • index_file_size:
    • (数据量固定,无增量数据的场景)提高此参数使得每个索引文件变大。合理范围为 1 ~ 4 GB。推荐大小为 1 ~ 2 GB。设置太小会导致索引过于分散。搜索时间远小于加载时间。达不到加载和搜索形成 pipeline 的效果。内存或显存允许的情况,该值设置的更大可以提高查询性能。使用 GPU 进行查询时,建议该值不要超过可用显存的 1/4。
    • (数据量不固定,连续有增量数据进入,并且伴随查询的场景)不宜设得太大,最好 256 MB 或者 512 MB,看具体情况而定。