节点健康检测快照

描述

节点健康检测快照 SDB_SNAP_HEALTH 列出数据库中所有节点的健康信息。

每一个节点上的健康检测信息为一条记录。

标示

SDB_SNAP_HEALTH

字段信息

字段名类型描述
NodeName字符串节点名,为“< HostName > : < ServiceName >”
IsPrimary布尔是否为主节点
ServiceStatus布尔是否为可提供服务状态
一些特殊状态,例如全量同步会使该状态为 false
Status字符串节点状态,为 “Normal” / “Rebuilding” / “FullSync” / “OfflineBackup”
BeginLSN.Offset长整型起始 LSN 的偏移
BeginLSN.Version整型起始 LSN 的版本号
CurrentLSN.Offset长整型当前 LSN 的偏移
CurrentLSN.Version整型当前 LSN 的版本号
CommittedLSN.Offset长整型已提交 LSN 的偏移
CommittedLSN.Version整型已提交 LSN 的版本号
CompleteLSN长整型已完成 LSN 的偏移
LSNQueSize整型等待同步的LSN队列长度
NodeID数组节点的 ID,为“[ <分区组 ID>, <节点 ID> ]”
在 standalone 模式下,该字段为“[ 0,0 ]”
DataStatus字符串数据状态 “Normal” / “Repairing” / “Fault”
SyncControl布尔节点是否处于同步控制
Ulimit.CoreFileSize长整型节点进程的core文件大小限制(-1表示unlimited)
Ulimit.VirtualMemory长整型节点进程的虚拟内存限制(-1表示unlimited)
Ulimit.OpenFiles长整型节点进程的文件句柄数限制
Ulimit.NumProc长整型节点进程的线程数限制(-1表示unlimited)
Ulimit.FileSize长整型节点进程的文件大小限制(-1表示unlimited)
ResetTimestamp时间戳重置快照的时间
ErrNum.SDB_OOM长整型节点发生错误 SDB_OOM 的次数
ErrNum.SDB_NOSPC长整型节点发生错误 SDB_NOSPC 的次数
ErrNum.SDB_TOO_MANY_OPEN_FD长整型节点发生错误 SDB_TOO_MANY_OPEN_FD 的次数
Memory.LoadPercent整型节点进程占用 RAM 的百分比
Memory.TotalRAM长整型节点所在操作系统的总 RAM 大小(单位:字节)
Memory.RssSize长整型节点进程占用的 RAM 大小(单位:字节)
Memory.LoadPercentVM整型节点进程占用虚拟空间的百分比
Memory.VMLimit长整型节点进程虚拟空间限制(单位:字节)
Memory.VMSize长整型节点进程占用的虚拟空间(单位:字节)
Disk.Name字符串节点路径所在的磁盘名称
Disk.LoadPercent整型节点路径占用磁盘的百分比
Disk.TotalSpace长整型节点路径所在的磁盘空间大小(单位:字节)
Disk.FreeSpace长整型节点路径所在的磁盘剩余空间大小(单位:字节)
FileDesp.LoadPercent整型节点进程占用的文件句柄的百分比
FileDesp.TotalNum长整型节点进程文件句柄限制
FileDesp.FreeNum长整型节点进程剩余的文件句柄个数
StartHistory数组节点启动历史(只取最新的十条记录)
AbnormalHistory数组节点异常后启动历史(只取最新的十条记录)
DiffLSNWithPrimary长整型与主节点的 LSN 差异

Note:

  • 协调节点的快照返回所有节点的信息。非协调节点返回自身节点的信息。
  • 备节点在计算与主节点的 LSN 差异时,所取的主节点 LSN 可能是2秒钟前的,因此 DiffLSNWithPrimary 可能与实际值存在一定偏差。(2秒是一个心跳间隔)

示例

查看数据节点 20000 上的健康检测信息

  1. > db.snapshot( SDB_SNAP_HEALTH )
  2. {
  3. "NodeName": "ubuntu-test-03:20000",
  4. "IsPrimary": true,
  5. "ServiceStatus": true,
  6. "Status": "Normal",
  7. "BeginLSN": {
  8. "Offset": 2721188688,
  9. "Version": 1
  10. },
  11. "CurrentLSN": {
  12. "Offset": -1,
  13. "Version": 0
  14. },
  15. "CommittedLSN": {
  16. "Offset": -1,
  17. "Version": 0
  18. },
  19. "CompleteLSN": 2721188688,
  20. "LSNQueSize": 0,
  21. "NodeID": [
  22. 1000,
  23. 1000
  24. ],
  25. "DataStatus": "Normal",
  26. "SyncControl": false,
  27. "Ulimit": {
  28. "CoreFileSize": -1,
  29. "VirtualMemory": -1,
  30. "OpenFiles": 1024,
  31. "NumProc": 23948,
  32. "FileSize": -1
  33. },
  34. "ResetTimestamp": "2018-03-09-09.47.04.826497",
  35. "ErrNum": {
  36. "SDB_OOM": 0,
  37. "SDB_NOSPC": 0,
  38. "SDB_TOO_MANY_OPEN_FD": 0
  39. },
  40. "Memory": {
  41. "LoadPercent": 3,
  42. "TotalRAM": 3157524480,
  43. "RssSize": 96591872,
  44. "LoadPercentVM": 0,
  45. "VMLimit": -1,
  46. "VMSize": 2380341248
  47. },
  48. "Disk": {
  49. "Name": "/dev/mapper/vgdata-lvdata1",
  50. "LoadPercent": 69,
  51. "TotalSpace": 52836298752,
  52. "FreeSpace": 16025624576
  53. },
  54. "FileDesp": {
  55. "LoadPercent": 3,
  56. "TotalNum": 1024,
  57. "FreeNum": 985
  58. },
  59. "StartHistory": [
  60. "2018-01-24-15.55.58.374162",
  61. "2018-01-24-15.55.00.318481"
  62. ],
  63. "CrashHistory": [
  64. "2018-01-24-15.55.58.374162"
  65. ],
  66. "DiffLSNWithPrimary": 0
  67. }
  68. Return 1 row(s).