TiFlash 常见问题
本文介绍了一些 TiFlash 常见问题、原因及解决办法。
TiFlash 未能正常启动
该问题可能由多个因素构成,可以通过以下步骤依次排查:
检查系统环境是否是 CentOS8。
CentOS8 中缺少
libnsl.so
系统库,可以通过手动安装的方式解决:dnf install libnsl
检查系统的
ulimit
参数设置。ulimit -n 1000000
使用 PD Control 工具检查在该节点(相同 IP 和 Port)是否有之前未成功下线的 TiFlash 实例,并将它们强制下线。(下线步骤参考手动缩容 TiFlash 节点)
如果遇到上述方法无法解决的问题,可以打包 TiFlash 的 log 文件夹,并在 AskTUG 社区中提问。
TiFlash 副本始终处于不可用状态
该问题一般由于配置错误或者环境问题导致 TiFlash 处于异常状态,可以先通过以下步骤定位问题组件:
使用 pd-ctl 检查 PD 的 Placement Rules 功能是否开启:
echo 'config show replication' | /path/to/pd-ctl -u http://${pd-ip}:${pd-port}
- 如果返回
true
,进入下一步。 - 如果返回
false
,你需要先开启 Placement Rules 特性 后再进入下一步。
通过 TiFlash-Summary 监控面板下的 UpTime 检查操作系统中 TiFlash 进程是否正常。
通过 pd-ctl 查看 TiFlash proxy 状态是否正常:
echo "store" | /path/to/pd-ctl -u http://${pd-ip}:${pd-port}
store.labels 中含有
{"key": "engine", "value": "tiflash"}
信息的为 TiFlash proxy。查看 pd buddy 是否正常打印日志(日志路径的对应配置项 [flash.flash_cluster] log 设置的值,默认为 TiFlash 配置文件配置的 tmp 目录下)。
检查配置的副本数是否小于等于集群 TiKV 节点数。若配置的副本数超过 TiKV 节点数,则 PD 不会向 TiFlash 同步数据;
echo 'config placement-rules show' | /path/to/pd-ctl -u http://${pd-ip}:${pd-port}
再确认 “default: count” 参数值。
注意:
开启 Placement Rules 后,原先的
max-replicas
及location-labels
配置项将不再生效。如果需要调整副本策略,应当使用 Placement Rules 相关接口。检查 TiFlash 节点对应 store 所在机器剩余的磁盘空间是否充足。默认情况下当磁盘剩余空间小于该 store 的 capacity 的 20%(通过 low-space-ratio 参数控制)时,PD 不会向 TiFlash 调度数据。
TiFlash 查询时间不稳定,同时错误日志中打印出大量的 Lock Exception
该问题是由于集群中存在大量写入,导致 TiFlash 查询时遇到锁并发生查询重试。
可以在 TiDB 中将查询时间戳设置为 1 秒前(例如:假设当前时间为 ‘2020-04-08 20:15:01’,可以在执行 query 前执行 set @@tidb_snapshot='2020-04-08 20:15:00';
),来减小 TiFlash 查询碰到锁的可能性,从而减轻查询时间不稳定的程度。
部分查询返回 Region Unavailable 的错误
如果在 TiFlash 上的负载压力过大,会导致 TiFlash 数据同步落后,部分查询可能会返回 Region Unavailable
的错误。
在这种情况下,可以增加 TiFlash 节点分担负载压力。
数据文件损坏
可依照如下步骤进行处理:
- 参照下线 TiFlash 节点下线对应的 TiFlash 节点。
- 清除该 TiFlash 节点的相关数据。
- 重新在集群中部署 TiFlash 节点。
TiFlash 分析慢
如果语句中含有 MPP 模式不支持的算子或函数等,TiDB 不会选择 MPP 模式,可能导致分析慢。此时,可以执行 EXPLAIN
语句检查 SQL 中是否含有 TiFlash 不支持的函数或算子。
create table t(a datetime);
alter table t set tiflash replica 1;
insert into t values('2022-01-13');
set @@session.tidb_enforce_mpp=1;
explain select count(*) from t where subtime(a, '12:00:00') > '2022-01-01' group by a;
show warnings;
示例中,warning 消息显示,因为 TiDB 5.4 及更早的版本尚不支持 subtime
函数的下推,因此 TiDB 没有选择 MPP 模式。
+---------+------+-----------------------------------------------------------------------------+
> | Level | Code | Message |
+---------+------+-----------------------------------------------------------------------------+
| Warning | 1105 | Scalar function 'subtime'(signature: SubDatetimeAndString, return type: datetime) is not supported to push down to tiflash now. |
+---------+------+-----------------------------------------------------------------------------+
TiFlash 数据不同步
在部署完 TiFlash 节点且进行了数据的同步操作(ALTER 操作)之后,如果实际没有数据同步到 TiFlash 节点,你可以通过以下步骤确认或解决问题:
检查同步操作是否执行。
执行
ALTER table <tbl_name> set tiflash replica <num>
操作,查看是否有正常返回:- 如果有正常返回,进入下一步。
- 如果无正常返回,请执行
SELECT * FROM information_schema.tiflash_replica
检查是否已经创建 TiFlash replica。如果没有,请重新执行ALTER table ${tbl_name} set tiflash replica ${num}
,查看是否有其他执行语句(如add index
),或者检查 DDL 操作是否正常。
检查 TiFlash 进程是否正常。
查看
progress
和tiflash_cluster_manager.log
日志中的flash_region_count
参数以及 TiFlash Uptime 是否有变化:- 如果有变化,说明 TiFlash 进程正常,进入下一步。
- 如果没有变化,说明 TiFlash 进程异常,请通过
tiflash
日志进一步排查。
使用 pd-ctl 检查 PD 的 Placement Rules 功能是否开启:
echo 'config show replication' | /path/to/pd-ctl -u http://<pd-ip>:<pd-port>
- 如果返回
true
,进入下一步。 - 如果返回
false
,你需要先开启 Placement Rules 特性,然后进入下一步。
检查集群副本数
max-replicas
配置是否合理。- 如果
max-replicas
取值未超过 TiKV 节点数,进入下一步。 如果
max-replicas
超过 TiKV 节点数,PD 不会向 TiFlash 同步数据。此时,请将max-replicas
修改为小于等于 TiKV 节点数的整数。注意:
max-replicas
的默认值是 3。在生产环境中,TiKV 节点数一般大于该值;在测试环境中,可以修改为 1。curl -X POST -d '{
"group_id": "pd",
"id": "default",
"start_key": "",
"end_key": "",
"role": "voter",
"count": 3,
"location_labels": [
"host"
]
}' <http://172.16.x.xxx:2379/pd/api/v1/config/rule>
- 如果
检查 TiFlash 与 TiDB 或 PD 的连接是否正常。
检查
flash_cluster_manager.log
日志,查找关键字ERROR
。- 如果没有关键字
ERROR
,说明连接正常,进入下一步。 如果有关键字
ERROR
,说明连接异常,请进行以下检查。检查日志文件中是否出现了 PD 相关关键字。
如果出现,请检查 TiFlash 配置文件中
raft.pd_addr
对应 PD 地址是否有效。检查方法:执行curl '{pd-addr}/pd/api/v1/config/rules'
,检查 5 秒内是否有正常返回。检查日志文件中是否出现了 TiDB 相关关键字。
如果出现,请检查 TiFlash 配置文件中
flash.tidb_status_addr
对应 TiDB 的 status 服务地址是否有效。检查方法:执行curl '{tidb-status-addr}/tiflash/replica'
, 检查 5 秒内是否有正常返回。检查节点间能否相互连通。
注意:
如问题依然无法解决,收集相关组件的日志进行排查。
- 如果没有关键字
检查表是否创建
placement-rule
。检查
flash_cluster_manager.log
日志,查找是否存在关键字Set placement rule … table-<table_id>-r
。- 有关键字,进入下一步。
- 没有关键字,收集相关组件的日志进行排查。
检查 PD 是否正常发起调度。
查看
pd.log
日志是否出现table-<table_id>-r
关键字,且之后是否出现add operator
之类的调度行为。- 是,PD 调度正常。
- 否,PD 调度异常,请联系 PingCAP 技术支持人员协助排查。
TiFlash 数据同步卡住
如果 TiFlash 数据一开始可以正常同步,过一段时间后全部或者部分数据无法继续同步,你可以通过以下步骤确认或解决问题:
检查磁盘空间。
检查磁盘使用空间比例是否高于
low-space-ratio
的值(默认值 0.8,即当节点的空间占用比例超过 80% 时,为避免磁盘空间被耗尽,PD 会尽可能避免往该节点迁移数据)。- 如果磁盘使用率大于等于
low-space-ratio
,说明磁盘空间不足。此时,请删除不必要的文件,如${data}/flash/
目录下的space_placeholder_file
文件(必要时可在删除文件后将reserve-space
设置为 0MB)。 - 如果磁盘使用率小于
low-space-ratio
,说明磁盘空间正常,进入下一步。
- 如果磁盘使用率大于等于
检查 TiKV、PD、TiFlash 之间的网络连接情况。
在
flash_cluster_manager.log
中,检查同步卡住的表对应的flash_region_count
是否有更新。- 没有更新,检查下一步。
有更新,检查是否有
down peer
(down peer
没有清理干净可能会导致同步卡住)。- 执行
pd-ctl region check-down-peer
命令检查是否有down peer
。 - 如果存在
down peer
,执行pd-ctl operator add remove-peer\<region-id> \<tiflash-store-id>
命令将其清除。
- 执行
查看 CPU 使用率。
在 Grafana 界面,选择 TiFlash-Proxy-Details > Thread CPU > Region task worker pre-handle/generate snapshot CPU,查看监控中
<instance-ip>:<instance-port>-region-worker
对应线程的 CPU 使用率。若曲线为一条直线,表示 TiFlash 发生卡死,可强制杀进程重启或联系 PingCAP 技术支持人员。
数据同步慢
同步慢可能由多种原因引起,你可以按以下步骤进行排查。
调整调度参数取值。
- 调大
store limit
,加快同步速度。 - 调小
config set patrol-region-interval 10ms
,增加 TiKV 侧 checker 扫描 Region 的频率。 - 调大
region merge
参数,减少 Region 数量,从而减少扫描数量,提高检查频次。
- 调大
调整 TiFlash 侧负载。
TiFlash 负载过大会引起同步慢,可通过 Grafana 中的 TiFlash-Summary 面板查看各个指标的负载情况:
Applying snapshots Count
:TiFlash-summary
>raft
>Applying snapshots Count
Snapshot Predecode Duration
:TiFlash-summary
>raft
>Snapshot Predecode Duration
Snapshot Flush Duration
:TiFlash-summary
>raft
>Snapshot Flush Duration
Write Stall Duration
:TiFlash-summary
>Storage Write Stall
>Write Stall Duration
generate snapshot CPU
:TiFlash-Proxy-Details
>Thread CPU
>Region task worker pre-handle/generate snapshot CPU
根据业务优先级,调整负载情况。