CurveFS基于minio-s3-gateway的S3协议支持

本文的部署方案是基于CurveFS挂载点+minio-s3-gateway方式,后续会考虑支持minio-s3-gateway+CurveFS SDK方式部署,将不再需要依赖CurveFS挂载点。

需求背景

AI训练业务场景下,业务希望通过S3接口上传训练所用到的数据集,实际训练过程中则想要使用CurveFS共享文件系统来实现多节点共享访问训练数据集,以及存储训练过程中产生的临时文件,并利用CurveFS为AI业务专门开发的文件/目录预热、内存缓存、本地盘缓存、分布式KV缓存特性,最终在低存储成本前提下的训练加速。

简单来说就是想要实现S3协议和Posix协议的统一命名空间能力,两种协议上传/写入的文件可以互相访问。本文简述相关部署过程,供有类似需求的社区小伙伴们参考。

部署前提

  1. 已经部署了一套CurveFS共享文件存储系统
  2. 已经挂载了一个CurveFS文件系统到服务器的/mnt/minio-data目录上
  3. 已安装docker运行环境

部署CurveFS和挂载文件系统的操作步骤可以参考Curve官方部署工具CurveAdm的用户手册:

部署步骤

这里使用minio-s3-gateway服务作为S3网关,并用docker进行部署,相关参考资料:https://github.com/minio/minio/blob/RELEASE.2022-04-26T01-20-24Z/docs/gateway/nas.md

  1. $ docker run --privileged -p 9000:9000 \
  2. --name curvefs-minio-s3-gateway \
  3. -v /mnt/minio-data:/data \
  4. -e "MINIO_ROOT_USER=minio-access-key" \
  5. -e "MINIO_ROOT_PASSWORD=minio-secret-key" \
  6. -e "MINIO_REGION=us-east-1" \
  7. --console-address ":9001" \
  8. docker.io/minio/minio:RELEASE.2022-04-26T01-20-24Z \
  9. gateway nas /data

执行上述命令就可以启动一个CurveFS的minio-s3-gateway服务,非常的简单方便。

如果部署成功,会在屏幕上打印如下内容:

  1. API: http://10.88.0.18:9000 http://127.0.0.1:9000
  2. Console: http://10.88.0.18:9001 http://127.0.0.1:9001
  3. Documentation: https://docs.min.io
  4. Finished loading IAM sub-system (took 0.0s of 0.0s to load data).
  5. ...... // 以下内容省略

Console地址就是web控制台地址,可以在浏览器里直接打开访问,用户名密码是上面docker命令行里配置的环境变量MINIO_ROOT_USERMINIO_ROOT_PASSWORD对应的值,参考资料:https://min.io/docs/minio/linux/administration/minio-console.html

功能验证

接下来我们部署一个minio的客户端,来验证S3网关的可用性,以及S3网关与CurveFS文件系统挂载点是否可以做到统一命名空间下互相访问文件。

部署minio客户端

minio客户端我们也是用docker来部署:

  1. $ docker run -it --entrypoint=/bin/sh minio/mc:RELEASE.2022-04-26T18-00-22Z

执行上述命令就可以启动一个minio命令行工具mc的运行环境了。

修改mc命令行的配置文件,默认是/root/.mc/config.json(如果容器内缺少编辑器不方便修改可以在本地修改好之后用docker cp命令复制进去):

  1. {
  2. "version": "10",
  3. "aliases": {
  4. "curvefs": {
  5. "url": "http://10.88.0.18:9000",
  6. "accessKey": "minio-access-key",
  7. "secretKey": "minio-secret-key",
  8. "api": "S3v4",
  9. "path": "auto"
  10. }
  11. }
  12. }

其中url就是部署minio-s3-gateway服务时屏幕打印的API地址,accessKey就是启动minio-s3-gateway容器的MINIO_ROOT_USERsecretKey就是MINIO_ROOT_PASSWORD,其他两个保持默认即可。curvefs是minio集群的别名,下面会用到。

统一命名空间功能验证

目标1:使用S3创建桶并上传文件,在CurveFS挂载点对应目录下访问

使用mc命令行工具分别进行创建桶、上传文件、列出桶内文件操作:

  1. $ mc mb curvefs/bucket1
  2. Bucket created successfully `curvefs/bucket1`.
  3. $ mc cp anaconda-ks.cfg curvefs/bucket1/
  4. /root/anaconda-ks.cfg: 7.53 KiB / 7.53 KiB ┃▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓┃ 777.03 KiB/s 0s
  5. $ mc ls curvefs/bucket1/
  6. [2023-04-25 09:16:37 UTC] 7.5KiB STANDARD anaconda-ks.cfg

在CurveFS的挂载点目录下列出目录和文件,并校验文件md5值(校验md5步骤省略,已确认一致):

  1. $ ls /mnt/minio-data/
  2. bucket1
  3. $ ls /mnt/minio-data/bucket1/
  4. anaconda-ks.cfg

目标2:使用S3上传包含子目录的文件到桶内,在CurveFS挂载点对应目录下访问

  1. $ mc cp curvefs/bucket1/dir1/bigfile.500M
  2. ...t1/dir1/bigfile.500M: 500.00 MiB / 500.00 MiB ┃▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓┃ 628.02 MiB/s 0s

在CurveFS的挂载点目录下列出目录和文件,并校验文件md5值(校验md5步骤省略,已确认一致):

  1. $ ls /mnt/minio-data/bucket1/dir1
  2. bigfile.500M

目标3:在CurveFS挂载点创建根目录及目录下的文件,使用S3查看桶及桶内文件

首先使用dd命令在CurveFS挂载点的bucket1目录下创建一个10M的文件:

  1. $ cd /mnt/minio-data/bucket1/dir1
  2. $ dd if=/dev/zero of=./newbigfile.10M bs=1M count=10

之后用mc命令查看桶内文件并下载后校验md5值(校验md5步骤省略,已确认一致):

  1. $ mc ls curvefs/bucket1/dir1
  2. [2023-04-25 09:29:33 UTC] 10MiB STANDARD newbigfile.10M
  3. $ mc cp curvefs/bucket1/dir1/newbigfile.10M .
  4. /root/newbigfile.10M: 10.00 MiB / 10.00 MiB ┃▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓┃ 76.14 MiB/s 0s

补充说明

高可用及单节点性能问题

这里的操作步骤均是单节点模式,如果要做到s3网关的高可用及防止性能瓶颈,可以在多台服务器上重复上述步骤,并给S3网关服务部署负载均衡服务(如Nginx或haproxy等),只需要CurveFS挂载的是同一个文件系统即可。

CurveAdm部署工具集成问题

本次实践是一次功能验证,后续Curve社区将把相关功能集成到CurveAdm部署工具中,方便用户使用维护。

minio gateway的废弃问题

minio的s3 gateway服务已经于2020年初开始逐步废弃了,但老版本的仍然可以继续使用,只需要指定版本号即可正常部署。如果有特殊需求,也可以fork minio的代码仓库自行定制修改。

参考资料:https://blog.min.io/deprecation-of-the-minio-gateway/