常见故障定位案例常见故障定位案例 core问题定位 TPCC运行时,注入磁盘满故障,TPCC卡住的问题 备机处于need repair(WAL)状态问题 内存不足问题 服务启动失败 出现“Error:No space left on device”提示 在XFS文件系统中,使用du命令查询数据文件大小大于文件实际大小 在XFS文件系统中,出现文件损坏 数据节点重建过程中重启集群,导致集群启动状态异常 switchover操作时,主机降备卡住 磁盘空间达到阈值,数据库只读 分析查询语句长时间运行的问题 分析查询语句运行状态 强制结束指定的问题会话 分析查询语句是否被阻塞 分析查询效率异常降低的问题 执行 SQL 语句时,提示 Lock wait timeout VACUUM FULL一张表后,表文件大小无变化 执行修改表分区操作时报错 不同用户查询同表显示数据不同 修改索引时只调用索引名提示索引不存在 重建索引失败 业务运行时整数转换错 高并发报错”too many clients already”或无法创建线程 btree 索引故障情况下应对策略