TiDB 事务概览

TiDB 支持完整的分布式事务,提供乐观事务悲观事务(TiDB 3.0 中引入)两种事务模型。本文主要介绍涉及到事务的语句、显式/隐式事务、事务的隔离级别和惰性检查,以及事务大小的限制。

常用的变量包括 autocommittidb_disable_txn_auto_retry 以及 tidb_retry_limit

常用事务语句

BEGINSTART TRANSACTION

语法:

  1. BEGIN;
  1. START TRANSACTION;
  1. START TRANSACTION WITH CONSISTENT SNAPSHOT;

以上三条语句都用于开启事务,效果相同。执行开启事务语句可以显式地开启一个新的事务。如果执行以上语句时,当前 Session 正处于一个事务的中间过程,那么系统会先自动提交当前事务,再开启一个新的事务。

COMMIT

语法:

  1. COMMIT;

该语句用于提交当前的事务,包括从 [BEGIN|START TRANSACTION]COMMIT 之间的所有修改。

ROLLBACK

语法:

  1. ROLLBACK;

该语句用于回滚当前事务,撤销从 [BEGIN|START TRANSACTION]ROLLBACK 之间的所有修改。

自动提交

语法:

  1. SET autocommit = {0 | 1}

autocommit = 1 时(默认),当前的 Session 为自动提交状态,即每条语句运行后,TiDB 会自动将修改提交到数据库中。设置 autocommit = 0 时更改当前 Session 更改为非自动提交状态,通过执行 COMMIT 语句来手动提交事务。

注意:

某些语句执行后会导致隐式提交。例如,执行 [BEGIN|START TRANCATION] 语句时,TiDB 会试图提交上一个事务,并开启一个新的事务。详情参见 implicit commit

另外,autocommit 也是一个系统变量,你可以通过变量赋值语句修改当前 Session 或 Global 的值。

  1. SET @@SESSION.autocommit = {0 | 1};
  1. SET @@GLOBAL.autocommit = {0 | 1};

显式事务和隐式事务

TiDB 可以显式地使用事务(通过 [BEGIN|START TRANSACTION]/COMMIT 语句定义事务的开始和结束) 或者隐式地使用事务 (SET autocommit = 1)。

在自动提交状态下,使用 [BEGIN|START TRANSACTION] 语句会显式地开启一个事务,同时也会禁用自动提交,使隐式事务变成显式事务。直到执行 COMMITROLLBACK 语句时才会恢复到此前默认的自动提交状态。

对于 DDL 语句,会自动提交并且不能回滚。如果运行 DDL 的时候,正在一个事务的中间过程中,会先自动提交当前事务,再执行 DDL。

事务隔离级别

TiDB 只支持 SNAPSHOT ISOLATION,可以通过下面的语句将当前 Session 的隔离级别设置为 READ COMMITTED,这只是语法上的兼容,事务依旧是以 SNAPSHOT ISOLATION 来执行。

  1. SET SESSION TRANSACTION ISOLATION LEVEL READ COMMITTED;

惰性检查

TiDB 中,对于普通的 INSERT 语句写入的值,会进行惰性检查。惰性检查的含义是,不在 INSERT 语句执行时进行唯一约束的检查,而在事务提交时进行唯一约束的检查。

举例:

  1. CREATE TABLE T (I INT KEY);
  2. INSERT INTO T VALUES (1);
  3. BEGIN;
  4. INSERT INTO T VALUES (1); -- MySQL 返回错误;TiDB 返回成功
  5. INSERT INTO T VALUES (2);
  6. COMMIT; -- MySQL 提交成功;TiDB 返回错误,事务回滚
  7. SELECT * FROM T; -- MySQL 返回 1 2TiDB 返回 1

惰性检查的意义在于,如果对事务中每个 INSERT 语句都立刻进行唯一性约束检查,将造成很高的网络开销。而在提交时进行一次批量检查,将会大幅提升性能。

注意:

本优化仅对普通的 INSERT 语句生效,对 INSERT IGNOREINSERT ON DUPLICATE KEY UPDATE 不会生效。

语句回滚

TiDB 支持语句执行的原子性回滚。在事务内部执行一个语句,遇到错误时,该语句整体不会生效。

  1. begin;
  2. insert into test values (1);
  3. insert into tset values (2); -- tset 拼写错误,使该语句执行出错。
  4. insert into test values (3);
  5. commit;

上面的例子里面,第二条语句执行失败,但第一和第三条语句仍然能正常提交。

  1. begin;
  2. insert into test values (1);
  3. insert into tset values (2); -- tset 拼写错误,使该语句执行出错。
  4. insert into test values (3);
  5. rollback;

以上例子中,第二条语句执行失败。由于调用了 ROLLBACK,因此事务不会将任何数据写入数据库。

事务大小

对于 TiDB 事务而言,事务太大或太小,都会影响事务的执行效率。

小事务

以如下 query 为例,当 autocommit = 1 时,下面三条语句各为一个事务:

  1. UPDATE my_table SET a ='new_value' WHERE id = 1;
  2. UPDATE my_table SET a ='newer_value' WHERE id = 2;
  3. UPDATE my_table SET a ='newest_value' WHERE id = 3;

此时每一条语句都需要经过两阶段提交,频繁的网络交互致使延迟率高。为提升事务执行效率,可以选择使用显式事务,即在一个事务内执行三条语句。

优化后版本:

  1. START TRANSACTION;
  2. UPDATE my_table SET a ='new_value' WHERE id = 1;
  3. UPDATE my_table SET a ='newer_value' WHERE id = 2;
  4. UPDATE my_table SET a ='newest_value' WHERE id = 3;
  5. COMMIT;

同理,执行 INSERT 语句时,建议使用显式事务。

注意:

由于 TiDB 中的资源是分布式的,TiDB 中单线程 workload 可能不会很好地利用分布式资源,因此性能相比于单实例部署的 MySQL 较低。这与 TiDB 中的事务延迟较高的情況类似。

大事务

由于 TiDB 两阶段提交的要求,修改数据的单个事务过大时会存在以下问题:

  • 客户端在提交之前,数据都写在内存中,而数据量过多时易导致 OOM (Out of Memory) 错误。
  • 在第一阶段写入数据耗时增加,与其他事务出现写冲突的概率会指数级增长。
  • 最终导致事务完成提交的耗时增加。

因此,TiDB 对事务做了一些限制:

  • 单个事务包含的 SQL 语句不超过 5000 条(默认)
  • 每个键值对不超过 6 MB
  • 键值对的总数不超过 300000
  • 键值对的总大小不超过 100 MB

为了使性能达到最优,建议每 100~500 行写入一个事务。