使用 TiDB Lightning 恢复 GCS 上的备份数据

本文描述了将 Kubernetes 上通过 TiDB Operator 备份的数据恢复到 TiDB 集群的操作过程。底层通过使用 TiDB Lightning 来进行集群恢复。

本文使用的恢复方式基于 TiDB Operator 新版(v1.1 及以上)的 CustomResourceDefinition (CRD) 实现。基于 Helm Charts 实现的备份和恢复方式可参考基于 Helm Charts 实现的 TiDB 集群备份与恢复

以下示例将存储在 Google Cloud Storage (GCS) 上指定路径上的集群备份数据恢复到 TiDB 集群。

环境准备

  1. 下载文件 backup-rbac.yaml,并执行以下命令在 test2 这个 namespace 中创建恢复所需的 RBAC 相关资源:

    1. kubectl apply -f backup-rbac.yaml -n test2
  2. 创建 restore-demo2-tidb-secret secret,该 secret 存放用来访问 TiDB 集群的 root 账号和密钥:

    1. kubectl create secret generic restore-demo2-tidb-secret --from-literal=user=root --from-literal=password=${password} --namespace=test2

将指定备份数据恢复到 TiDB 集群

  1. 创建 restore custom resource (CR),将指定的备份数据恢复至 TiDB 集群:

    1. kubectl apply -f restore.yaml

    restore.yaml 文件内容如下:

    1. ---
    2. apiVersion: pingcap.com/v1alpha1
    3. kind: Restore
    4. metadata:
    5. name: demo2-restore
    6. namespace: test2
    7. spec:
    8. to:
    9. host: ${tidb_host}
    10. port: ${tidb_port}
    11. user: ${tidb_user}
    12. secretName: restore-demo2-tidb-secret
    13. gcs:
    14. projectId: ${project_id}
    15. secretName: gcs-secret
    16. path: gcs://${backup_path}
    17. storageClassName: local-storage
    18. storageSize: 1Gi
  2. 创建好 Restore CR 后可通过以下命令查看恢复的状态:

    1. kubectl get rt -n test2 -owide

以上示例将存储在 GCS 上指定路径 spec.gcs.path 的备份数据恢复到 TiDB 集群 spec.to.host。关于 GCS 的配置项可以参考 backup-gcs.yaml 中的配置。

更多 Restore CR 字段的详细解释如下:

  • .spec.metadata.namespaceRestore CR 所在的 namespace。
  • .spec.to.host:待恢复 TiDB 集群的访问地址。
  • .spec.to.port:待恢复 TiDB 集群访问的端口。
  • .spec.to.user:待恢复 TiDB 集群的访问用户。
  • .spec.to.tidbSecretName:待恢复 TiDB 集群所需凭证的 secret。
  • .spec.storageClassName:指定恢复时所需的 PV 类型。如果不指定该项,则默认使用 TiDB Operator 启动参数中 default-backup-storage-class-name 指定的值(默认为 standard)。
  • .spec.storageSize:恢复集群时指定所需的 PV 大小。该值应大于备份 TiDB 集群数据的大小。