DM 集群性能测试

本文档介绍如何构建测试场景对 DM 集群进行性能测试,包括数据迁移速度、延迟等。

迁移数据流

可以使用简单的迁移数据流来测试 DM 集群的数据迁移性能,即单个 MySQL 实例到 TiDB 的数据迁移:MySQL -> DM -> TiDB。

部署测试环境

  • 使用 TiUP 部署 TiDB 测试集群,所有配置使用 TiUP 提供的默认配置。
  • 部署 MySQL 服务,开启 ROW 模式 binlog,其他配置项使用默认配置。
  • 部署 DM 集群,部署一个 DM-worker 和一个 DM-master 即可。

性能测试

迁移数据表结构

使用如下结构的表进行性能测试:

  1. CREATE TABLE `sbtest` (
  2. `id` int(11) NOT NULL AUTO_INCREMENT,
  3. `k` int(11) NOT NULL DEFAULT '0',
  4. `c` char(120) CHARSET utf8mb4 COLLATE utf8mb4_bin NOT NULL DEFAULT '',
  5. `pad` char(60) CHARSET utf8mb4 COLLATE utf8mb4_bin NOT NULL DEFAULT '',
  6. PRIMARY KEY (`id`),
  7. KEY `k_1` (`k`)
  8. ) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_bin

全量导入性能测试用例

生成测试数据

使用 sysbench 在上游创建测试表,并生成全量导入的测试数据。sysbench 生成数据的命令如下所示:

  1. sysbench --test=oltp_insert --tables=4 --mysql-host=172.16.4.40 --mysql-port=3306 --mysql-user=root --mysql-db=dm_benchmark --db-driver=mysql --table-size=50000000 prepare

创建数据迁移任务

  1. 创建上游 MySQL 的 source,将 source-id 配置为 source-1。详细操作方法参考:加载数据源配置

  2. 创建 full 模式的 DM 迁移任务,示例任务配置文件如下:

    1. ---
    2. name: test-full
    3. task-mode: full
    4. # 使用实际测试环境中 TiDB 的信息配置
    5. target-database:
    6. host: "192.168.0.1"
    7. port: 4000
    8. user: "root"
    9. password: ""
    10. mysql-instances:
    11. -
    12. source-id: "source-1"
    13. block-allow-list: "instance" # 如果 DM 版本早于 v2.0.0-beta.2 则使用 black-white-list
    14. mydumper-config-name: "global"
    15. loader-thread: 16
    16. # 配置 sysbench 生成数据所在的库的名称
    17. block-allow-list: # 如果 DM 版本早于 v2.0.0-beta.2 则使用 black-white-list
    18. instance:
    19. do-dbs: ["dm_benchmark"]
    20. mydumpers:
    21. global:
    22. rows: 32000
    23. threads: 32

创建数据迁移任务的详细操作参考创建数据迁移任务

注意:

  • mydumpers 配置项中使用 rows 选项,可以开启单表多线程并发导出,加快数据导出速度。
  • mysql-instances 配置中的 loader-thread 以及 mydumpers 配置项中的 rowsthreads 可以做适当调整,测试在不同配置下对性能的影响。

获取测试结果

观察 DM-worker 日志,当出现 all data files have been finished 时,表示全量数据导入完成,此时可以看到消耗时间。示例日志如下:

  1. [INFO] [loader.go:604] ["all data files have been finished"] [task=test] [unit=load] ["cost time"=52.439796ms]

根据测试数据的数据量和导入消耗时间,可以算出全量数据的迁移速度。

增量复制性能测试用例

初始化表

使用 sysbench 在上游创建测试表。

创建数据迁移任务

  1. 创建上游 MySQL 的 source, source-id 配置为 source-1(如果在全量迁移性能测试中已经创建,则不需要再次创建)。详细操作方法参考:加载数据源配置

  2. 创建 all 模式的 DM 迁移任务,示例任务配置文件如下:

    1. ---
    2. name: test-all
    3. task-mode: all
    4. # 使用实际测试环境中 TiDB 的信息配置
    5. target-database:
    6. host: "192.168.0.1"
    7. port: 4000
    8. user: "root"
    9. password: ""
    10. mysql-instances:
    11. -
    12. source-id: "source-1"
    13. block-allow-list: "instance" # 如果 DM 版本早于 v2.0.0-beta.2 则使用 black-white-list
    14. syncer-config-name: "global"
    15. # 配置 sysbench 生成数据所在的库的名称
    16. block-allow-list: # 如果 DM 版本早于 v2.0.0-beta.2 则使用 black-white-list
    17. instance:
    18. do-dbs: ["dm_benchmark"]
    19. syncers:
    20. global:
    21. worker-count: 16
    22. batch: 100

创建数据迁移任务的详细操作参考创建数据迁移任务

注意:

syncers 配置项中的 worker-countbatch 可以做适当调整,测试在不同配置下性能的差异。

生成增量数据

执行 sysbench 命令在上游持续生成增量数据:

  1. sysbench --test=oltp_insert --tables=4 --num-threads=32 --mysql-host=172.17.4.40 --mysql-port=3306 --mysql-user=root --mysql-db=dm_benchmark --db-driver=mysql --report-interval=10 --time=1800 run

注意:

可以通过调整 sysbench 的语句类型,测试在不同业务场景下 DM 的数据迁移性能。

获取测试结果

通过 query-status 命令观测 DM 的迁移状态,通过 Grafana 观测 DM 的监控指标。主要包括单位时间内完成的 job 数量 finished sqls jobs 等,详细的监控指标说明参考 Binlog replication 监控指标