节点健康检测快照
标识
SDB_SNAP_HEALTH
描述
节点健康检测快照列出数据库中所有节点的健康信息。
字段信息
字段名 | 类型 | 描述 |
---|---|---|
NodeName | 字符串 | 节点名(主机名:服务名) |
IsPrimary | 布尔 | 是否主节点 |
ServiceStatus | 布尔 | 是否为可提供服务状态。 一些特殊状态,例如 全量同步 时,服务状态为 false |
Status | 字符串 | 节点状态: 1.”Normal”:正常工作状态。 2.”Shutdown”:正在关闭状态,表示节点正在被关闭。 3.”Rebuilding”:重新构建状态,如节点异常重启后,无法与其他节点进行数据同步,则节点会进入该状态,重新构建数据。 4.”FullSync”:全量同步状态。 5.”OfflineBackup”:数据备份状态。 |
BeginLSN | BSON 对象 | 起始 LSN |
CurrentLSN | BSON 对象 | 当前 LSN |
CommittedLSN | BSON 对象 | 已提交 LSN |
CompleteLSN | 长整型 | 已完成 LSN 的偏移 |
LSNQueSize | 整型 | 等待同步的 LSN 队列长度 |
NodeID | BSON 数组 | 节点的 ID 信息 |
DataStatus | 字符串 | 数据状态: 1.”Normal”: 正常状态。 2.”Repairing”:修复状态,当节点状态为 “Rebuilding” 或 “FullSync” 时,数据状态为 “Repairing”。 3.”Fault”:错误状态,当节点异常启动,且节点状态不为”Rebuilding” 或 “FullSync” 时,数据状态为 “Fault”。 |
SyncControl | 布尔 | 节点是否处于同步控制 |
Ulimit | BSON 对象 | 节点进程可占用资源的信息 |
ResetTimestamp | 时间戳 | 重置快照的时间 |
ErrNum | BSON 对象 | 节点错误的统计信息 |
Memory | BSON 对象 | 节点进程占用 RAM 的百分比 |
Disk | BSON 对象 | 节点路径所在的磁盘名称 |
FileDesp | BSON 对象 | 节点进程占用的文件句柄的百分比 |
StartHistory | BSON 数组 | 节点启动历史(只取最新的十条记录) |
AbnormalHistory | BSON 数组 | 节点异常后启动历史(只取最新的十条记录) |
DiffLSNWithPrimary | 长整型 | 与主节点的 LSN 差异 |
BeginLSN 对象的字段
字段名 | 类型 | 描述 |
---|---|---|
Offset | 长整型 | 起始 LSN 的偏移 |
Version | 整型 | 起始 LSN 的版本号 |
CurrentLSN 对象的字段
字段名 | 类型 | 描述 |
---|---|---|
Offset | 长整型 | 当前 LSN 的偏移 |
Version | 整型 | 当前 LSN 的版本号 |
CommittedLSN 对象的字段
字段名 | 类型 | 描述 |
---|---|---|
Offset | 长整型 | 已提交 LSN 的偏移 |
Version | 整型 | 已提交 LSN 的版本号 |
NodeID 数组的字段
数组下标 | 类型 | 描述 |
---|---|---|
0 | 整型 | 分区组 ID,在 standalone 模式下,该值为 0 |
1 | 整型 | 节点 ID,在 standalone 模式下,该值为 0 |
Ulimit 对象的字段
字段名 | 类型 | 描述 |
---|---|---|
CoreFileSize | 长整型 | 节点进程的core文件大小限制(-1表示unlimited,单位:字节) |
VirtualMemory | 长整型 | 节点进程的虚拟内存限制(-1表示unlimited,单位:字节) |
OpenFiles | 长整型 | 节点进程的文件句柄数限制 |
NumProc | 长整型 | 节点进程的线程数限制(-1 表示 unlimited) |
FileSize | 长整型 | 节点进程的文件大小限制(-1表示unlimited,单位:字节) |
StackSize | 长整型 | 节点进程的栈空间大小限制(-1表示unlimited,单位:字节) |
ErrNum 对象的字段
字段名 | 类型 | 描述 |
---|---|---|
SDB_OOM | 长整型 | 发生 SDB_OOM 错误的次数 |
SDB_NOSPC | 长整型 | 发生 SDB_NOSPC 错误的次数 |
SDB_TOO_MANY_OPEN_FD | 长整型 | 发生 SDB_TOO_MANY_OPEN_FD 错误的次数 |
Memory 对象的字段
字段名 | 类型 | 描述 |
---|---|---|
LoadPercent | 整型 | 节点进程占用 RAM 的百分比 |
TotalRAM | 长整型 | 节点所在操作系统的总 RAM 大小(单位:字节) |
RssSize | 长整型 | 节点进程占用的 RAM 大小(单位:字节) |
LoadPercentVM | 整型 | 节点进程占用虚拟空间的百分比 |
VMLimit | 长整型 | 节点进程虚拟空间限制(单位:字节) |
VMSize | 长整型 | 节点进程占用的虚拟空间(单位:字节) |
Disk 对象的字段
字段名 | 类型 | 描述 |
---|---|---|
Name | 字符串 | 节点路径所在的磁盘名称 |
LoadPercent | 整型 | 节点路径占用磁盘的百分比 |
TotalSpace | 长整型 | 节点路径所在的磁盘空间大小(单位:字节) |
FreeSpace | 长整型 | 节点路径所在的磁盘剩余空间大小(单位:字节) |
FileDesp 对象的字段
字段名 | 类型 | 描述 |
---|---|---|
LoadPercent | 整型 | 节点进程占用的文件句柄的百分比 |
TotalNum | 长整型 | 节点进程文件句柄限制 |
FreeNum | 长整型 | 节点进程剩余的文件句柄个数 |
Note:
协调节点的快照返回所有节点的信息。非协调节点返回自身节点的信息。
备节点在计算与主节点的 LSN 差异时,所取的主节点 LSN 可能是2秒钟前的,因此 DiffLSNWithPrimary 可能与实际值存在一定偏差。(2秒是一个心跳间隔)
示例
> db.snapshot( SDB_SNAP_HEALTH )
{
"NodeName": "sdbserver1:11830",
"IsPrimary": true,
"ServiceStatus": true,
"Status": "Normal",
"BeginLSN": {
"Offset": 0,
"Version": 1
},
"CurrentLSN": {
"Offset": 260,
"Version": 1
},
"CommittedLSN": {
"Offset": 260,
"Version": 1
},
"CompleteLSN": 344,
"LSNQueSize": 0,
"NodeID": [
1000,
1000
],
"DataStatus": "Normal",
"SyncControl": false,
"Ulimit": {
"CoreFileSize": 0,
"VirtualMemory": -1,
"OpenFiles": 60000,
"NumProc": 3810,
"FileSize": -1,
"StackSize": 524288
},
"ResetTimestamp": "2019-03-20-16.39.34.998686",
"ErrNum": {
"SDB_OOM": 0,
"SDB_NOSPC": 0,
"SDB_TOO_MANY_OPEN_FD": 0
},
"Memory": {
"LoadPercent": 13,
"TotalRAM": 1040396288,
"RssSize": 144764928,
"LoadPercentVM": 0,
"VMLimit": -1,
"VMSize": 1605918720
},
"Disk": {
"Name": "/dev/sda1",
"LoadPercent": 23,
"TotalSpace": 40596905984,
"FreeSpace": 31001866240
},
"FileDesp": {
"LoadPercent": 0,
"TotalNum": 60000,
"FreeNum": 59953
},
"StartHistory": [
"2019-03-20-16.39.35.050963"
],
"AbnormalHistory": [],
"DiffLSNWithPrimary": 0
}
...