$SNAPSHOT_HEALTH

描述

节点健康检测快照 $SNAPSHOT_HEALTH 列出数据库中所有节点的健康信息。

每一个节点上的健康检测信息为一条记录。

标示

$SNAPSHOT_HEALTH

字段信息

字段名类型描述
NodeName字符串节点名,为“< HostName > : < ServiceName >”
IsPrimary布尔是否为主节点
ServiceStatus布尔是否为可提供服务状态
一些特殊状态,例如全量同步会使该状态为 false
Status字符串节点状态,为 “Normal” / “Rebuilding” / “FullSync” / “OfflineBackup”
BeginLSN.Offset长整型起始 LSN 的偏移
BeginLSN.Version整型起始 LSN 的版本号
CurrentLSN.Offset长整型当前 LSN 的偏移
CurrentLSN.Version整型当前 LSN 的版本号
CommittedLSN.Offset长整型已提交 LSN 的偏移
CommittedLSN.Version整型已提交 LSN 的版本号
CompleteLSN长整型已完成 LSN 的偏移
LSNQueSize整型等待同步的LSN队列长度
NodeID数组节点的 ID,为“[ <分区组 ID>, <节点 ID> ]”
在 standalone 模式下,该字段为“[ 0,0 ]”
DataStatus字符串数据状态 “Normal” / “Repairing” / “Fault”
SyncControl布尔节点是否处于同步控制
Ulimit.CoreFileSize长整型节点进程的core文件大小限制(-1表示unlimited)
Ulimit.VirtualMemory长整型节点进程的虚拟内存限制(-1表示unlimited)
Ulimit.OpenFiles长整型节点进程的文件句柄数限制
Ulimit.NumProc长整型节点进程的线程数限制(-1表示unlimited)
Ulimit.FileSize长整型节点进程的文件大小限制(-1表示unlimited)
ResetTimestamp时间戳重置快照的时间
ErrNum.SDB_OOM长整型节点发生错误 SDB_OOM 的次数
ErrNum.SDB_NOSPC长整型节点发生错误 SDB_NOSPC 的次数
ErrNum.SDB_TOO_MANY_OPEN_FD长整型节点发生错误 SDB_TOO_MANY_OPEN_FD 的次数
Memory.LoadPercent整型节点进程占用 RAM 的百分比
Memory.TotalRAM长整型节点所在操作系统的总 RAM 大小(单位:字节)
Memory.RssSize长整型节点进程占用的 RAM 大小(单位:字节)
Memory.LoadPercentVM整型节点进程占用虚拟空间的百分比
Memory.VMLimit长整型节点进程虚拟空间限制(单位:字节)
Memory.VMSize长整型节点进程占用的虚拟空间(单位:字节)
Disk.Name字符串节点路径所在的磁盘名称
Disk.LoadPercent整型节点路径占用磁盘的百分比
Disk.TotalSpace长整型节点路径所在的磁盘空间大小(单位:字节)
Disk.FreeSpace长整型节点路径所在的磁盘剩余空间大小(单位:字节)
FileDesp.LoadPercent整型节点进程占用的文件句柄的百分比
FileDesp.TotalNum长整型节点进程文件句柄限制
FileDesp.FreeNum长整型节点进程剩余的文件句柄个数
StartHistory数组节点启动历史(只取最新的十条记录)
AbnormalHistory数组节点异常后启动历史(只取最新的十条记录)
DiffLSNWithPrimary长整型与主节点的 LSN 差异

Note:

  • 协调节点的快照返回所有节点的信息。非协调节点返回自身节点的信息。
  • 备节点在计算与主节点的 LSN 差异时,所取的主节点 LSN 可能是2秒钟前的,因此 DiffLSNWithPrimary 可能与实际值存在一定偏差。(2秒是一个心跳间隔)

示例

查看数据节点 20000 上的健康检测信息

  1. > db.exec( "select * from $SNAPSHOT_HEALTH" )
  2. {
  3. "NodeName": "hostname:20000",
  4. "IsPrimary": true,
  5. "ServiceStatus": true,
  6. "Status": "Normal",
  7. "BeginLSN": {
  8. "Offset": 0,
  9. "Version": 1
  10. },
  11. "CurrentLSN": {
  12. "Offset": 1050290908,
  13. "Version": 1
  14. },
  15. "CommittedLSN": {
  16. "Offset": 1050290908,
  17. "Version": 1
  18. },
  19. "CompleteLSN": 1050290984,
  20. "LSNQueSize": 0,
  21. "NodeID": [
  22. 1000,
  23. 1000
  24. ],
  25. "DataStatus": "Normal",
  26. "SyncControl": false,
  27. "Ulimit": {
  28. "CoreFileSize": 0,
  29. "VirtualMemory": -1,
  30. "OpenFiles": 1024,
  31. "NumProc": 23711,
  32. "FileSize": -1
  33. },
  34. "ResetTimestamp": "2019-05-31-09.37.59.316262",
  35. "ErrNum": {
  36. "SDB_OOM": 0,
  37. "SDB_NOSPC": 0,
  38. "SDB_TOO_MANY_OPEN_FD": 0
  39. },
  40. "Memory": {
  41. "LoadPercent": 11,
  42. "TotalRAM": 6257471488,
  43. "RssSize": 701349888,
  44. "LoadPercentVM": 0,
  45. "VMLimit": -1,
  46. "VMSize": 2491211776
  47. },
  48. "Disk": {
  49. "Name": "/dev/mapper/vgdata-lvdata1",
  50. "LoadPercent": 34,
  51. "TotalSpace": 211139878912,
  52. "FreeSpace": 138432405504
  53. },
  54. "FileDesp": {
  55. "LoadPercent": 4,
  56. "TotalNum": 1024,
  57. "FreeNum": 973
  58. },
  59. "StartHistory": [
  60. "2019-05-31-09.37.59.581769"
  61. ],
  62. "AbnormalHistory": [],
  63. "DiffLSNWithPrimary": 0
  64. }