关于流控

流量控制是指通过一些手段来控制读写请求的速度。

为什么要做流量控制？主要是减小集群压力，提升稳定性。如果集群的写流量太大，就会消耗大量的系统资源（CPU、IO等），从而影响读请求的延迟。有些业务对读性能要求比较高，如果对写流量不加控制，就无法保证服务质量。

从流控的作用位置来看，可分为：

客户端流控：从源头掐住流量。优点是避免不必要的网络传输；缺点是需要在客户端增加逻辑，且因为无法掌控用户的使用方式造成流控难以准确。
服务端流控：在ReplicaServer节点上进行流控。优点是对客户端透明，流控集中容易掌控；缺点是只能通过增大延迟或者拒绝请求的方式来流控，不够直接，另外可能无法避免不必要的网络传输。从流控的粒度来看，可分为：
表级流控：只控制单个表的流控，粒度较细。
节点级流控：针对ReplicaServer节点进行的流控，不区分具体的表。

客户端流控

目前Java客户端提供了流控工具，参见Java客户端文档#流量控制。

服务端流控

表级流控

从1.11.2版本开始，Pegasus支持Server端表级流控，目前只针对写操作。

实现原理：

用户在Table环境变量中设置replica.write_throttling环境变量。
MetaServer将环境变量异步地通知到各个ReplicaServer，使该表的每个replica都获取到该环境变量，这个过程大约有几秒到几十秒不等的延迟，但是不会超过一分钟。
replica获得环境变量后，解析获得write_throttling流控配置，并立即开始生效。 write_throttling流控目前支持两种操作类型：
delay：server端收到请求后不立即处理，而是推迟一段时间后再处理，这样使client端的写延迟增大，间接达到流控的目的。
reject：server端收到请求后不进行处理，而是返回ERR_BUSY的错误码。可以推迟一段时间再返回错误码，以增大客户端收到错误的延迟，避免客户端立即重试，造成频繁的不必要重试。环境变量replica.write_throttling的value格式：

{delay_qps_threshold}*delay*{delay_ms},{reject_qps_threshold}*reject*{delay_ms_before_reject}

注：

delay_qps_threshold：触发delay操作的QPS阈值。如果1秒内处理的写请求数超过这个值，则这1秒内后面的请求都执行delay操作。
delay_ms：delay操作的推迟时间，单位毫秒，需满足>=0。
reject_qps_threshold：触发reject操作的QPS阈值。如果1秒内处理的写请求数超过这个值，则这1秒内后面的请求都执行reject操作。
delay_ms_before_reject：reject操作返回错误码之前的推迟时间，单位毫秒，需满足>=0。
delay和reject配置可以同时提供两个，也可以只提供其中一个。
如果delay和reject配置同时提供，且QPS同时达到了delay和reject的阈值，那么会执行reject操作。示例：

$ ./run.sh shell
>>> use temp
OK
>>> set_app_envs replica.write_throttling 1000*delay*100,2000*reject*200
set app envs succeed
>>> get_app_envs
get app envs succeed, count = 1
=================================
replica.write_throttling = 1000*delay*100,2000*reject*200
=================================
>>>

上面我们设置了temp表的write_throttling配置为1000delay100,2000reject200，这个配置的意思是：当QPS超过1000时，就开始执行delay操作；当QPS超过2000时，就开始执行reject操作。

节点级流控

待补充。