关于流控

流量控制是指通过一些手段来控制读写请求的速度。

为什么要做流量控制?主要是减小集群压力,提升稳定性。如果集群的写流量太大,就会消耗大量的系统资源(CPU、IO等),从而影响读请求的延迟。有些业务对读性能要求比较高,如果对写流量不加控制,就无法保证服务质量。

从流控的作用位置来看,可分为:

  • 客户端流控:从源头掐住流量。优点是避免不必要的网络传输;缺点是需要在客户端增加逻辑,且因为无法掌控用户的使用方式造成流控难以准确。
  • 服务端流控:在ReplicaServer节点上进行流控。优点是对客户端透明,流控集中容易掌控;缺点是只能通过增大延迟或者拒绝请求的方式来流控,不够直接,另外可能无法避免不必要的网络传输。 从流控的粒度来看,可分为:

  • 表级流控:只控制单个表的流控,粒度较细。

  • 节点级流控:针对ReplicaServer节点进行的流控,不区分具体的表。

客户端流控

目前Java客户端提供了流控工具,参见Java客户端文档#流量控制

服务端流控

表级流控

1.11.2版本开始,Pegasus支持Server端表级流控,目前只针对写操作。

实现原理:

  • 用户在Table环境变量中设置replica.write_throttling环境变量。
  • MetaServer将环境变量异步地通知到各个ReplicaServer,使该表的每个replica都获取到该环境变量,这个过程大约有几秒到几十秒不等的延迟,但是不会超过一分钟。
  • replica获得环境变量后,解析获得write_throttling流控配置,并立即开始生效。 write_throttling流控目前支持两种操作类型:

  • delay:server端收到请求后不立即处理,而是推迟一段时间后再处理,这样使client端的写延迟增大,间接达到流控的目的。

  • reject:server端收到请求后不进行处理,而是返回ERR_BUSY的错误码。可以推迟一段时间再返回错误码,以增大客户端收到错误的延迟,避免客户端立即重试,造成频繁的不必要重试。 环境变量replica.write_throttling的value格式:
  1. {delay_qps_threshold}*delay*{delay_ms},{reject_qps_threshold}*reject*{delay_ms_before_reject}

注:

  • delay_qps_threshold:触发delay操作的QPS阈值。如果1秒内处理的写请求数超过这个值,则这1秒内后面的请求都执行delay操作。
  • delay_ms:delay操作的推迟时间,单位毫秒,需满足>=0。
  • reject_qps_threshold:触发reject操作的QPS阈值。如果1秒内处理的写请求数超过这个值,则这1秒内后面的请求都执行reject操作。
  • delay_ms_before_reject:reject操作返回错误码之前的推迟时间,单位毫秒,需满足>=0。
  • delay和reject配置可以同时提供两个,也可以只提供其中一个。
  • 如果delay和reject配置同时提供,且QPS同时达到了delay和reject的阈值,那么会执行reject操作。 示例:
  1. $ ./run.sh shell
  2. >>> use temp
  3. OK
  4. >>> set_app_envs replica.write_throttling 1000*delay*100,2000*reject*200
  5. set app envs succeed
  6. >>> get_app_envs
  7. get app envs succeed, count = 1
  8. =================================
  9. replica.write_throttling = 1000*delay*100,2000*reject*200
  10. =================================
  11. >>>

上面我们设置了temp表的write_throttling配置为1000delay100,2000reject200,这个配置的意思是:当QPS超过1000时,就开始执行delay操作;当QPS超过2000时,就开始执行reject操作。

节点级流控

待补充。