BACKUP

BACKUP - 图1

警告

BACKUP 语句目前为实验特性,不建议在生产环境中使用。该功能可能会在未事先通知的情况下发生变化或删除。如果发现 bug,请在 GitHub 上提 issue 反馈。

BACKUP 语句用于对 TiDB 集群执行分布式备份操作。

BACKUP 语句使用的引擎与 BR 相同,但备份过程是由 TiDB 本身驱动,而非单独的 BR 工具。BR 工具的优势和警告也适用于 BACKUP 语句。

执行 BACKUP 需要 BACKUP_ADMINSUPER 权限。此外,执行备份的 TiDB 节点和集群中的所有 TiKV 节点都必须有对目标存储的读或写权限。

BACKUP 语句开始执行后将会被阻塞,直到整个备份任务完成、失败或取消。因此,执行 BACKUP 时需要准备一个持久的连接。如需取消任务,可执行 KILL TIDB QUERY 语句。

一次只能执行一个 BACKUPRESTORE 任务。如果 TiDB server 上已经在执行一个 BACKUPRESTORE 语句,新的 BACKUP 将等待前面所有的任务完成后再执行。

语法图

BackupStmt

BACKUP - 图2

BRIETables

BACKUP - 图3

BackupOption

BACKUP - 图4

Boolean

BACKUP - 图5

BackupTSO

BACKUP - 图6

  1. BackupStmt ::=
  2. "BACKUP" BRIETables "TO" stringLit BackupOption*
  3. BRIETables ::=
  4. "DATABASE" ( '*' | DBName (',' DBName)* )
  5. | "TABLE" TableNameList
  6. BackupOption ::=
  7. "RATE_LIMIT" '='? LengthNum "MB" '/' "SECOND"
  8. | "CONCURRENCY" '='? LengthNum
  9. | "CHECKSUM" '='? Boolean
  10. | "SEND_CREDENTIALS_TO_TIKV" '='? Boolean
  11. | "LAST_BACKUP" '='? BackupTSO
  12. | "SNAPSHOT" '='? ( BackupTSO | LengthNum TimestampUnit "AGO" )
  13. Boolean ::=
  14. NUM | "TRUE" | "FALSE"
  15. BackupTSO ::=
  16. LengthNum | stringLit

示例

备份数据库

  1. BACKUP DATABASE `test` TO 'local:///mnt/backup/2020/04/';
  1. +------------------------------+-----------+-----------------+---------------------+---------------------+
  2. | Destination | Size | BackupTS | Queue Time | Execution Time |
  3. +------------------------------+-----------+-----------------+---------------------+---------------------+
  4. | local:///mnt/backup/2020/04/ | 248665063 | 416099531454472 | 2020-04-12 23:09:48 | 2020-04-12 23:09:48 |
  5. +------------------------------+-----------+-----------------+---------------------+---------------------+
  6. 1 row in set (58.453 sec)

上述示例中,test 数据库被备份到本地,数据以 SST 文件的形式存储在分布于所有 TiDB 和 TiKV 节点的 /mnt/backup/2020/04/ 目录中。

输出结果的第一行描述如下:

列名描述
Destination目标存储的 URL
Size备份文件的总大小,单位为字节
BackupTS创建备份时的快照 TSO(用于增量备份
Queue TimeBACKUP 任务开始排队的时间戳(当前时区)
Execution TimeBACKUP 任务开始执行的时间戳(当前时区)

备份表

  1. BACKUP TABLE `test`.`sbtest01` TO 'local:///mnt/backup/sbtest01/';
  1. BACKUP TABLE sbtest02, sbtest03, sbtest04 TO 'local:///mnt/backup/sbtest/';

备份集群

  1. BACKUP DATABASE * TO 'local:///mnt/backup/full/';

注意,备份中不包含系统表(mysql.*INFORMATION_SCHEMA.*PERFORMANCE_SCHEMA.* 等)。

外部存储

BR 支持备份数据到 Amazon S3 或 Google Cloud Storage (GCS):

  1. BACKUP DATABASE `test` TO 's3://example-bucket-2020/backup-05/?access-key={YOUR_ACCESS_KEY}&secret-access-key={YOUR_SECRET_KEY}';

有关详细的 URL 语法,见外部存储服务的 URI 格式

当运行在云环境中时,不能分发凭证,可设置 SEND_CREDENTIALS_TO_TIKV 选项为 FALSE

  1. BACKUP DATABASE `test` TO 's3://example-bucket-2020/backup-05/'
  2. SEND_CREDENTIALS_TO_TIKV = FALSE;

性能调优

如果你需要减少网络带宽占用,可以通过 RATE_LIMIT 来限制每个 TiKV 节点的平均上传速度。

在备份完成之前,BACKUP 将对集群上的数据执行校验和以验证数据正确性。如果你确定无需进行校验,可以通过将 CHECKSUM 参数设置为 FALSE 来禁用该检查。

要指定 BR 可以同时执行的备份表和索引的任务数量,可使用 CONCURRENCY。该参数控制 BR 的线程池大小,可以优化备份操作的性能和效率。根据备份类型不同,一个任务代表一个表范围或一个索引范围。如果有一个表带有一个索引,则会有两个任务来备份这个表。参数 CONCURRENCY 的默认值为 4,如果你要备份许多表或索引,需调大该参数的值。

  1. BACKUP DATABASE `test` TO 's3://example-bucket-2020/backup-06/'
  2. RATE_LIMIT = 120 MB/SECOND
  3. CONCURRENCY = 8
  4. CHECKSUM = FALSE;

快照

可以指定一个时间戳、TSO 或相对时间,来备份历史数据。

  1. -- 相对时间
  2. BACKUP DATABASE `test` TO 'local:///mnt/backup/hist01'
  3. SNAPSHOT = 36 HOUR AGO;
  4. -- 时间戳(当前时区)
  5. BACKUP DATABASE `test` TO 'local:///mnt/backup/hist02'
  6. SNAPSHOT = '2020-04-01 12:00:00';
  7. -- TSO
  8. BACKUP DATABASE `test` TO 'local:///mnt/backup/hist03'
  9. SNAPSHOT = 415685305958400;

对于相对时间,支持以下时间单位:

  • MICROSECOND(微秒)
  • SECOND(秒)
  • MINUTE(分钟)
  • HOUR(小时)
  • DAY(天)
  • WEEK(周)

注意,相对时间的单位遵循 SQL 标准,永远使用单数。

增量备份

提供 LAST_BACKUP 选项,只备份从上一次备份到当前快照之间的增量数据。

  1. -- 时间戳(当前时区)
  2. BACKUP DATABASE `test` TO 'local:///mnt/backup/hist02'
  3. LAST_BACKUP = '2020-04-01 12:00:00';
  4. -- TSO
  5. BACKUP DATABASE `test` TO 'local:///mnt/backup/hist03'
  6. LAST_BACKUP = 415685305958400;

MySQL 兼容性

该语句是 TiDB 对 MySQL 语法的扩展。

另请参阅