Changefeed 日志过滤器
TiCDC 支持基于表和事件两个维度的过滤功能,本文分别介绍两种过滤器的使用方法。
Table Filter 表过滤器
TiCDC 支持基于库表名的过滤功能,你可以通过下列配置来选定或过滤掉指定的表:
[filter]
# 过滤器规则
rules = ['*.*', '!test.*']
常见的过滤器规则示例:
rules = ['*.*']
- 同步所有的表(不包含系统表)
rules = ['test1.*']
- 同步库
test1
下的所有表
- 同步库
rules = ['*.*', '!scm1.tbl2']
- 同步所有的表但排除表
scm1.tbl2
- 同步所有的表但排除表
rules = ['scm1.tbl2', 'scm1.tbl3']
- 只同步表
scm1.tbl2
和scm1.tbl3
- 只同步表
rules = ['scm1.tidb_*']
- 同步库
scm1
下所有表名前缀为tidb_
的表
- 同步库
更多用法说明参见:库表过滤语法
Event Filter 事件过滤器 从 v6.2.0 版本开始引入
TiCDC 在 v6.2.0 中新增了事件过滤器功能,你可以通过配置该规则来过滤符合指定条件的 DML 和 DDL 事件。
以下是事件过滤器的配置规则示例:
[filter]
# 事件过滤器的规则应该写在 filter 配置项之下,可以同时配置多个事件过滤器。
[[filter.event-filters]]
matcher = ["test.worker"] # 该过滤规则只应用于 test 库中的 worker 表
ignore-event = ["insert"] # 过滤掉 insert 事件
ignore-sql = ["^drop", "add column"] # 过滤掉以 "drop" 开头或者包含 "add column" 的 DDL
ignore-delete-value-expr = "name = 'john'" # 过滤掉包含 name = 'john' 条件的 delete DML
ignore-insert-value-expr = "id >= 100" # 过滤掉包含 id >= 100 条件的 insert DML
ignore-update-old-value-expr = "age < 18 or name = 'lili'" # 过滤掉旧值 age < 18 或 name = 'lili' 的 update DML
ignore-update-new-value-expr = "gender = 'male' and age > 18" # 过滤掉新值 gender = 'male' 且 age > 18 的 update DML
配置参数说明:
matcher
:该事件过滤器所要匹配的数据库名和表名,其匹配规则和表库过滤规则相一致。ignore-event
:要过滤的事件类型,它是一个字符串数组,可以配置多个事件类型。目前支持的类型如下表所示:
Event | 分类 | 别名 | 说明 |
---|---|---|---|
all dml | 匹配所有 DML events | ||
all ddl | 匹配所有 DDL events | ||
insert | DML | 匹配 insert DML event | |
update | DML | 匹配 update DML event | |
delete | DML | 匹配 delete DML event | |
create schema | DDL | create database | 匹配 create database event |
drop schema | DDL | drop database | 匹配 drop database event |
create table | DDL | 匹配 create table event | |
drop table | DDL | 匹配 drop table event | |
rename table | DDL | 匹配 rename table event | |
truncate table | DDL | 匹配 truncate table event | |
alter table | DDL | 匹配 alter table event (包含 alter table 的所有子句和 create/drop index) | |
add table partition | DDL | 匹配 add table partition event | |
drop table partition | DDL | 匹配 drop table partition event | |
truncate table partition | DDL | 匹配 truncate table partition event | |
create view | DDL | 匹配 create view event | |
drop view | DDL | 匹配 drop view event |
ignore-sql
:要过滤的 DDL 语句的正则表达式。该参数接受一个字符串数组,数组中可以配置多条正则表达式。该配置仅对 DDL 事件生效。ignore-delete-value-expr
:配置一个 SQL 表达式,对带有指定值的 DELETE 类型的 DML 事件生效。ignore-insert-value-expr
:配置一个 SQL 表达式,对带有指定值的 INSERT 类型的 DML 事件生效。ignore-update-old-value-expr
:配置一个 SQL 表达式,对带有指定旧值的 UPDATE 类型的 DML 事件生效。ignore-update-new-value-expr
:配置一个 SQL 表达式,对带有指定新值的 UPDATE 类型的 DML 事件生效。
注意
TiDB 在更新聚簇索引的列值时,会将一个 UPDATE 事件拆分成为 DELETE 和 INSERT 事件,TiCDC 无法将该类事件识别为 UPDATE 事件,因此无法正确地进行过滤。
在配置 SQL 表达式时,请确保符合 matcher 规则的所有表均包含了对应 SQL 表达式中指明的所有列,否则同步任务将无法创建成功。此外,若在同步的过程中表的结构发生变化,不再包含 SQL 表达式中的列,那么同步任务将会进入无法自动恢复的错误状态,你需要手动修改配置并进行恢复操作。