本节介绍如何为 Kubernetes 原生事件和 Kubernetes/KubeSphere 审计事件定义告警规则。
前提条件
您需要在 KubeSphere 企业版平台具有 platform-admin 角色。
KubeSphere 企业版平台需要安装并启用 WhizardTelemetry 事件告警扩展组件。
操作步骤
在任意集群节点上,创建一个 yaml 文件,为该集群定义事件和审计的告警规则。
点击此处查看完整的告警规则示例。简单示例如下:
apiVersion: logging.whizard.io/v1alpha1
kind: ClusterRuleGroup
metadata:
name: example-auditing-rule
namespace: kubesphere-logging-system
spec:
type: auditing
rules:
- desc: all action not need to be audit
expr:
kind: list
list:
- get
- list
- watch
name: ignore-action
- desc: all operator need to be audit
expr:
kind: list
list:
- create
- delete
- update
- patch
name: action
- desc: pod
expr:
kind: macro
macro: ObjectRef.Resource="pods"
name: pod
- desc: service
expr:
kind: macro
macro: ObjectRef.Resource="services"
name: service
- desc: the alias of the user related to audit event
expr:
alias: User.username
kind: alias
name: user
告警规则目前支持两种类型:审计和事件。在
spec.type
下配置不同类型的告警规则,如type: auditing
或type: events
。告警规则的设置项如下:
参数 描述 name
规则名称。
desc
规则描述。
expr.kind
规则类型,取值可以为
rule
,macro
,list
, 或alias
。expr.condition
日志的过滤表达式,以检查日志是否与规则匹配。可使用比较运算符(=,!=,<,⇐,>,>=,contains,in,like,regexp)、布尔运算符(and,or 和 not)以及括号进行组合。
expr.macro
macro 的条件。
expr.list
list 的值。
expr.alias
alias 的值。
enable
如果为 false,规则将不生效。
alerts.output
指定在匹配事件发生时输出的消息。
alerts.annotations
规则的注解,包含在匹配事件发生时输出的告警消息。
alerts.annotations.summary
指定在匹配事件发生时输出的摘要消息。
alerts.annotations.summaryCn
指定在匹配事件发生时输出的中文摘要消息。
alerts.severity
规则的告警级别,取值可以为 INFO、WARNING、ERROR、或 CRITICAL。
Macro
宏(Macro)是规则条件片段,可以在规则内部甚至其他宏中重复使用。宏提供了一种命名常见模式和消除规则冗余的方法。以下是一个宏的示例:
apiVersion: logging.whizard.io/v1alpha1
kind: ClusterRuleGroup
metadata:
name: macro-rule
spec:
type: auditing
rules:
- desc: pod
expr:
kind: macro
macro: ObjectRef.Resource="pods"
name: pod
说明 宏可以在规则或其他宏中使用,例如
${pod}
或${alerting-rule.pod}
。这两种方法的区别在于${pod}
只能用于alerting-rule
,而${alerting-rule.pod}
可以用于所有实例。宏也可用于 list 和 alias。list
列表(List)是可以包含在规则、宏或其他列表中的项目集合。与规则和宏不同,列表不能被解析为过滤表达式。以下是一个列表的示例:
apiVersion: logging.whizard.io/v1alpha1
kind: ClusterRuleGroup
metadata:
name: list-rule
spec:
type: alerting
rules:
- desc: all action not need to be audit
expr:
kind: list
list:
- get
- list
- watch
name: ignore-action
Alias
别名(Alias)是过滤字段的缩写名称,它可以包含在规则、宏、列表和输出字符串中。以下是一个别名的示例:
apiVersion: logging.whizard.io/v1alpha1
kind: ClusterRuleGroup
metadata:
name: alias-rule
spec:
type: alerting
rules:
- desc: the alias of the user related to audit event
expr:
alias: User.username
kind: alias
name: user
执行以下命令,创建 CRD(定制资源定义)。
kubectl apply -f xxx.yaml # 注意替换 yaml 文件的名称
运行成功后,在集群管理 > 定制资源定义页面搜索 ClusterRuleGroup。
点击 ClusterRuleGroup 进入详情页,在右侧页面查看、编辑或删除告警规则。