PingCAP Clinic 数据采集说明

本文提供了 PingCAP Clinic 诊断服务(以下简称为 PingCAP Clinic)在使用 TiUP 部署的 TiDB 集群和 DM 集群中能够采集的诊断数据类型,并列出了各个采集项对应的采集参数。当执行 Clinic Diag 诊断客户端(以下简称为 Diag)数据采集命令时,你可以依据需要采集的数据类型,在命令中添加所需的采集参数。

通过 PingCAP Clinic 在使用 TiUP 部署的集群中采集的数据用于诊断和分析集群问题。

Clinic Server 是部署在云端的云服务,根据数据存储的位置不同,分为以下两个独立的服务:

  • Clinic Server 中国区:如果你把采集的数据上传到了 Clinic Server 中国区,这些数据将存储于 PingCAP 设立在 AWS 中国区(北京)的 S3 服务。PingCAP 对数据访问权限进行了严格的访问控制,只有经授权的内部技术人员可以访问该数据。
  • Clinic Server 美国区:如果你把采集的数据上传到了 Clinic Server 美国区,这些数据将存储于 PingCAP 设立在 AWS 美国区的 S3 服务。PingCAP 对数据访问权限进行了严格的访问控制,只有经授权的内部技术人员可以访问该数据。

TiDB 集群

本节列出了 Diag 在使用 TiUP 部署的 TiDB 集群中能够采集的诊断数据类型。

TiDB 集群信息

诊断数据类型 输出文件 PingCAP Clinic 采集参数
集群基础信息,包括集群 ID cluster.json 每次收集默认采集
集群详细信息 meta.yaml 每次收集默认采集

TiDB 诊断数据

诊断数据类型 输出文件 PingCAP Clinic 采集参数
日志 tidb.log --include=log
Error 日志 tidb_stderr.log --include=log
慢日志 tidb_slow_query.log --include=log
配置文件 tidb.toml --include=config
实时配置 config.json --include=config

TiKV 诊断数据

诊断数据类型 输出文件 PingCAP Clinic 采集参数
日志 tikv.log --include=log
Error 日志 tikv_stderr.log --include=log
配置文件 tikv.toml --include=config
实时配置 config.json --include=config

PD 诊断数据

诊断数据类型 输出文件 PingCAP Clinic 采集参数
日志 pd.log --include=log
Error 日志 pd_stderr.log --include=log
配置文件 pd.toml --include=config
实时配置 config.json --include=config
tiup ctl pd -u http://${pd IP}:${PORT} store 的输出结果 store.json --include=config
tiup ctl pd -u http://${pd IP}:${PORT} config placement-rules show 的输出结果 placement-rule.json --include=config

TiFlash 诊断数据

诊断数据类型 输出文件 PingCAP Clinic 采集参数
日志 tiflash.log --include=log
Error 日志 tiflash_stderr.log --include=log
配置文件 tiflash-learner.tomltiflash-preprocessed.tomltiflash.toml --include=config
实时配置 config.json --include=config

TiCDC 诊断数据

诊断数据类型 输出文件 PingCAP Clinic 采集参数
日志 ticdc.log --include=log
Error 日志 ticdc_stderr.log --include=log
配置文件 ticdc.toml --include=config
Debug 数据 info.txtstatus.txtchangefeeds.txtcaptures.txtprocessors.txt --include=debug(默认不采集)

Prometheus 监控数据

诊断数据类型 输出文件 PingCAP Clinic 采集参数
所有的 Metrics 数据 {metric_name}.json --include=monitor
Alert 列表 alerts.json --include=monitor

TiDB 系统变量

诊断数据类型 输出文件 PingCAP Clinic 采集参数
获取 TiDB 系统变量(默认不采集,采集需要额外提供数据库帐号) mysql.tidb.csv --include=db_vars(默认不采集)
global_variables.csv --include=db_vars(默认不采集)

集群节点的系统信息

诊断数据类型 输出文件 PingCAP Clinic 采集参数
内核日志 dmesg.log --include=system
系统和硬件的基础信息 insight.json --include=system
系统 /etc/security/limits.conf 中的内容 limits.conf --include=system
内核参数列表 sysctl.conf --include=system
socket 统计信息(即 ss 的命令结果) ss.txt --include=system

DM 集群

本节列出了 Diag 在使用 TiUP 部署的 DM 集群中能够采集的诊断数据类型。

DM 集群信息

诊断数据类型 输出文件 PingCAP Clinic 采集参数
集群基础信息,包括集群 ID cluster.json 每次收集默认采集
集群详细信息 meta.yaml 每次收集默认采集

dm-master 诊断数据

诊断数据类型 输出文件 PingCAP Clinic 采集参数
日志 m-master.log --include=log
Error 日志 dm-master_stderr.log --include=log
配置文件 dm-master.toml --include=config

dm-worker 诊断数据

诊断数据类型 输出文件 PingCAP Clinic 采集参数
日志 dm-worker.log --include=log
Error 日志 dm-worker_stderr.log --include=log
配置文件 dm-work.toml --include=config

Prometheus 监控数据

诊断数据类型 输出文件 PingCAP Clinic 采集参数
所有的 Metrics 数据 {metric_name}.json --include=monitor
Alert 列表 alerts.json --include=monitor

集群节点的系统信息

诊断数据类型 输出文件 PingCAP Clinic 采集参数
内核日志 dmesg.log --include=system
系统和硬件基础信息 insight.json --include=system
系统 /etc/security/limits.conf 中的内容 limits.conf --include=system
内核参数列表 sysctl.conf --include=system
socket 统计信息(即 ss 的命令结果) ss.txt --include=system