问1:INSERT/UPDATE/DELETE被解析为Query或DDL语句?
答1:出现这类情况主要原因为收到的binlog就为Query事件,比如:
- binlog格式为非row模式,通过show variables like 'binlog_format'可以查看. 针对statement/mixed模式,DML语句都会是以SQL语句存在
- mysql5.6+之后,在binlog为row模式下,针对DML语句通过一个开关(binlog-rows-query-log-events=true),记录DML的原始SQL,对应binlog事件为RowsQueryLogEvent,同时也有对应的row记录. ps. canal可以通过properties设置来过滤:canal.instance.filter.query.dml = true
问2:设置了数据表的过滤条件,但貌似没有生效?
答2:
- 首先看文档AdminGuide,了解canal.instance.filter.regex的书写格式
mysql 数据解析关注的表,Perl正则表达式.
多个正则之间以逗号(,)分隔,转义符需要双斜杠(\)
常见例子:
- 所有表:. or .\..*
- canal schema下所有表: canal\..*
- canal下的以canal打头的表:canal\.canal.*
- canal schema下的一张表:canal.test1
- 多个规则组合使用:canal\..*,mysql.test1,mysql.test2 (逗号分隔)
- 检查binlog格式,过滤条件只针对row模式的数据有效(ps. mixed/statement因为不解析sql,所以无法准确提取tableName进行过滤)
- 检查下CanalConnector是否调用subscribe(filter)方法;有的话,filter需要和instance.properties的canal.instance.filter.regex一致,否则subscribe的filter会覆盖instance的配置,如果subscribe的filter是...,那么相当于你消费了所有的更新数据 【特别注意】
- 检查一下历史的issue列表,很有可能你的提问别人已经遇到过并解决了,比如表达式不对,特别是双斜杠的问题
问3:canal是否支持aliyun rds的binlog订阅?
答3: 参考issue:https://github.com/alibaba/canal/issues/727
问4:canal的整体性能怎么样?
答4:
- 参考issue: https://github.com/alibaba/canal/issues/726
- 参考性能测试文档:https://github.com/alibaba/canal/wiki/Performance
问5: 出现batchId:73 is not the firstly:72 或 clientId:1001 batchId:50560 is not exist , please check
答5:
- 第一个原因是client在ack的问题,前两个异常是client没有按照顺序ack对应的batchId
- 最后一个是ack的batchId在服务端被清理了ps. 服务端发生清理只有两个原因:
- client发起过一次rollback
- server端发生过一次instance的重启,比如scan=true时发现文件变化自动restart了
问6:Received error packet: errno = 1236, sqlstate = HY000 errmsg = Could not find first log file name in binary log index file
答6: 出现dump异常时,建议把errno/errmsg到google上搜索一下,这个异常是mysql标准返回的,代表对应的binlog位点在mysql里不存在,应该是被mysql server清理掉了,解决办法:重置一下canal订阅位点