访问限流
限流规则说明
北极星支持在界面配置单机限流规则,通过以下路径可以打开限流规则的编辑页面:控制台->服务列表->具体服务->限流规则->新建,打开后,规则各配置项说明如下:
限流类型
单机限流:单机限流是一种通过统计单机QPS指标,当达到规则指定阈值时对流量进行限制,保障服务实例不被瞬时流量给冲垮。
分布式限流:分布式限流是一种通过统计全局QPS指标,当达到规则指定阈值时对流量进行限制,保障服务实例不被瞬时流量给冲垮。
接口名称
可选,指定限流规则的接口过滤参数,接口名可对应方法名、http url等信息,不填代表不过滤。
- 接口:规则生效所对应的接口名,用于匹配客户端传入的method参数,默认为
空(全部)
- 匹配方式:接口字段的匹配方式,支持全匹配、不等于、包含、不包含、正则表达式四种匹配模式
请求匹配规则
可选,指定限流规则的请求参数匹配条件,不填代表不过滤,支持以下四种参数类型:
自定义参数:自定义KEY和VALUE,具体的请求参数值可通过SDK进行传入。
请求头(HEADER):针对协议消息头(http header/grpc header)进行过滤。
请求参数(QUERY):针对协议请求参数(http query)进行过滤。
方法(METHOD):针对协议的METHOD(http method/grpc method)进行过滤。
主调服务:针对微服务调用场景下,主调方的服务名进行过滤。
主调IP:针对主调方机器的IP地址进行过滤。
每种类型参数值支持以下几种值匹配模式:
全匹配:全值匹配,传入的值与配置的值相同才匹配通过。
正则表达式:用户配置正则表达式,通过正则表达式对传入的值进行匹配,正则表达式支持Google RE2标准。
不等于:取反匹配,传入的值与所配置的值不相等才算匹配成功。
包含:多字符串取OR匹配,传入的值只要匹配到其中一个字符串,就算匹配成功。字符串之间使用逗号进行分割。值格式为’value1,value2,value3‘,匹配到其中一个就算成功。
不包含:多字符串取反匹配,传入的值必须都没有出现在所配置的字符串列表中,才算匹配通过。值格式为’value1,value2,value3‘,全部不等于才算成功。
限流阈值
指定统计周期内的统计阈值,达到阈值则进行限流。可以配置多个限流阈值,多个限流阈值可同时生效,任意触发了一个就进行限流。
- 统计时长:限流阈值的统计时长,单位秒,默认为1秒
- 请求数:达到限流条件的请求数阈值。默认为1
限流效果
限流阈值被触发后,如何进行对流量进行限制,目前支持2种模式(默认为直接拒绝):
- 直接拒绝:当统计时长内请求数达到阈值,后续新的请求会被拒绝,直到下个统计周期到来才恢复。
- 匀速排队:基于漏桶算法,将请求数平均分配到统计时长内(细分的最小度量单位为1ms),从而控制请求以均匀的速度通过。
失败退化策略
分布式限流需要依赖token server,如果出现token server不可访问,则客户端可以根据配置的规则进行降级,保证用户请求最大限度不受影响。
- 退化成单机限流:默认策略。直接退化成单机计算配额的方式进行限流,单机配额=(全局配额/节点数)。
- 直接通过:不执行限流,所有请求都直接放通。
使用场景
针对服务进行限流
在RateLimitServiceJava服务下新建限流规则,指定QPS为10,限流效果选择直接拒绝。
针对接口+标签进行细粒度限流
在RateLimitServiceJava服务下新建限流规则,指定QPS为10,方法名为/echo,标签键为user,值为foo,限流效果选择直接拒绝。
使用匀速排队
在RateLimitServiceJava服务下新建限流规则,指定QPS为10,限流效果选择匀速排队。