日常巡检

TiDB 作为分布式数据库，对比单机数据库机制更加复杂。自带的 metrics 和监控项丰富。为了更便捷地运维 TiDB，本文介绍 TiDB 集群需要常关注的关键指标项。

Dashboard 关键指标

从 4.0 版本开始，TiDB 提供了一个新的 Dashboard 运维管理工具，集成在 PD 组件上，默认地址为 http://pd-ip:pd_port/dashboard。

TiDB Dashboard 从用户角度出发，简化管理员对 TiDB 数据库的运维，可在一个界面查看整个分布式数据库集群的运行状况，包括数据热点、SQL 运行情况、集群信息、日志搜索、实时性能分析等。

以上实例面板注意项说明如下：

通过主机面板可以查看 CPU、内存、磁盘使用率。当任何资源的平均使用率超过 60%，推荐安排扩容计划，达到 80%，推荐进行扩容。

通过 SQL 分析面板可以分析对集群影响较大的慢 SQL，然后进行对应的 SQL 优化。

以上面板说明如下：

miss-peer-region-count 是缺副本，不会一直大于 0。
extra-peer-region-count 是多副本，调度过程中会有产生。
empty-region-count 是空 Region，一般是 TRUNCATE TABLE/DROP TABLE 语句导致。如果数量较多，可以考虑开启跨表 Region merge。
pending-peer-region-count 是 Raft log 落后的 Region。由于调度产生少量的 pending peer 是正常的，但是如果持续很高，可能有问题。
down-peer-region-count 是 Raft leader 上报有不响应 peer 的 Region 数量。
offline-peer-region-count 是下线过程中的 Region 数量。

原则上来说，该监控面板偶尔有数据是符合预期的。但长期有数据，需要排查是否存在问题。