健康检查
我们可以在集群级别为网关开启健康检查。
开启健康检查后,edge-admin 会按照配置,向 edge-node 发起检查请求, 如果不符合预期,则认为该 node 不健康。
注意:需要 edge-admin 到 edge-node 的网络是通畅的,才可以开启健康检查,否则会因为网络不通,node 节点会被 admin 认为是不健康。
开启网关集群健康检查
我们首先点击进入网关节点
页面,里面列出了已经存在的网关集群:
我们点击一个网关集群的 编辑按钮,可以看到有一个健康检查的开关
开启健康检查之后,我们进一步配置健康检查的参数:
Edge 支持三种健康检查模式:
- tcp
- http
- https
意味着 edge admin 会向 edge node 发送
- tcp connection
- http 请求
- https 请求
对于 tcp 检查模式,只需要 tcp 连接成功,就认为 node 是健康的。 对于 http/https 模式,还可以配置期望的期望的响应状态码,或者响应体需要包含的字符串模式。
点击保存,就会开启健康检查。
当某个网关节点连续检查不健康的次数达到配置的阈值, Edge 会自动将该节点标记为 “离线” 状态((此时在界面上,节点 IP 前的绿色指示灯会变成红色)。 意味着:该节点会自动从 DNS 和 集群内缓存服务中剔除。
我们还可以查看健康检查的具体日志:
这里可以每个 node 节点最近的检查成功/失败次数,以及失败的原因。