本文主要介绍 OceanBase 路径选择的规则体系。目前 OceanBase 路径选择的规则体系分为前置规则(正向规则)和Skyline 剪枝规则(反向规则)。

前置规则直接决定了一个查询使用什么样的索引,是一个强匹配的规则体系。

Skyline 剪枝规则会两两比较两个索引,如果一个索引在一些定义的维度上优于(dominate)另外一个索引,那么被dominated 的那个索引会被剪掉,最后没有被剪掉的索引会进行代价比较,从而选出最优的计划。

目前 OceanBase 的优化器会优先使用前置规则选择索引,如果没有匹配的索引,那么 Skyline 剪枝规则会剪掉一些被dominated 的索引,最后代价模型会在没有被剪掉的索引中选择代价最低的路径。

如下例所示,OceanBase 的计划展示中会输出相应的路径选择的规则信息。

  1. OceanBase (root@test)> create table t1(a int primary key, b int, c int, d int, e int, unique index k1(b), index k2(b,c), index k3(c,d));
  2. Query OK, 0 rows affected (0.38 sec)
  3. OceanBase (root@test)> explain extended select * from t1 where b = 1;
  4. | =====================================
  5. |ID|OPERATOR |NAME |EST. ROWS|COST|
  6. -------------------------------------
  7. |0 |TABLE SCAN|t1(k1)|2 |94 |
  8. =====================================
  9. Outputs & filters:
  10. -------------------------------------
  11. 0 - output([t1.a(0x7f3178058bf0)], [t1.b(0x7f3178058860)], [t1.c(0x7f3178058f80)], [t1.d(0x7f3178059310)], [t1.e(0x7f31780596a0)]), filter(nil),
  12. access([t1.b(0x7f3178058860)], [t1.a(0x7f3178058bf0)], [t1.c(0x7f3178058f80)], [t1.d(0x7f3178059310)], [t1.e(0x7f31780596a0)]), partitions(p0),
  13. is_index_back=true,
  14. range_key([t1.b(0x7f3178058860)], [t1.shadow_pk_0(0x7f31780784b8)]), range(1,MIN ; 1,MAX),
  15. range_cond([t1.b(0x7f3178058860) = 1(0x7f31780581d8)])
  16. Optimization Info:
  17. -------------------------------------
  18. t1:optimization_method=rule_based, heuristic_rule=unique_index_with_indexback
  19. OceanBase (root@test)> explain extended select * from t1 where c < 5 order by c;
  20. | ====================================
  21. |ID|OPERATOR |NAME|EST. ROWS|COST|
  22. ------------------------------------
  23. |0 |SORT | |200 |1054|
  24. |1 | TABLE SCAN|t1 |200 |666 |
  25. ====================================
  26. Outputs & filters:
  27. -------------------------------------
  28. 0 - output([t1.a(0x7f3178059220)], [t1.b(0x7f31780595b0)], [t1.c(0x7f3178058e90)], [t1.d(0x7f3178059940)], [t1.e(0x7f3178059cd0)]), filter(nil), sort_keys([t1.c(0x7f3178058e90), ASC])
  29. 1 - output([t1.c(0x7f3178058e90)], [t1.a(0x7f3178059220)], [t1.b(0x7f31780595b0)], [t1.d(0x7f3178059940)], [t1.e(0x7f3178059cd0)]), filter([t1.c(0x7f3178058e90) < 5(0x7f3178058808)]),
  30. access([t1.c(0x7f3178058e90)], [t1.a(0x7f3178059220)], [t1.b(0x7f31780595b0)], [t1.d(0x7f3178059940)], [t1.e(0x7f3178059cd0)]), partitions(p0),
  31. is_index_back=false, filter_before_indexback[false],
  32. range_key([t1.a(0x7f3178059220)]), range(MIN ; MAX)always true
  33. t1:optimization_method=cost_based, avaiable_index_name[t1,k3], pruned_index_name[k1,k2]

其中 optimization_method 展示了具体的规则信息,它有以下两种形式:

  • 如果 optimization_method=rule_based, 那么就是命中了前置规则,同时会展示出具体命中的规则名称,unique_index_with_indexback 表示命中了前置规则的第三条规则(唯一性索引全匹配+回表+回表数量少于一定的阈值)。
  • 如果 optimization_method=cost_based, 那么就是基于代价选择出来的,同时会展示出来 skyline 剪枝规则剪掉了那些访问路径(pruned_index_name) 以及剩下了那些访问路径(avaiable_index_name)。

前置规则

目前 OceanBase 的前置规则只使用在简单的单表扫描上,因为前置规则是一个强匹配的规则体系,一旦命中,就直接选择命中的索引,所以要限制它的使用场景,以防选错计划。目前 OceanBase 根据查询条件是否能覆盖所有索引键以及使用该索引是否需要回表这两个信息把前置规则按照优先级划分成如下三个匹配:

  • 唯一性索引全匹配+不需要回表(主键被当成唯一性索引来处理),那么选择该索引。如果存在多个这样的索引,选择索引列数最小的一个。

  • 普通索引全匹配+不需要回表,那么选择该索引。如果存在多个这样的索引,选择索引列数最小的一个。

  • 唯一性索引全匹配+回表+回表数量少于一定的阈值,那么选择该索引。如果存在多个这样的索引,选择回表数量最小的一个。

这里需要注意的是索引全匹配是指在索引键上都存在等值条件(对应于get or multi-get)。对于如下 schema 和查询,对于查询 Q1,它命中了索引 uk1(唯一性索引全匹配+不需要回表)。对于查询 Q2,它命中了索引 uk2(唯一性索引全匹配+回表+回表行数最多4行)。

  1. create table test(
  2. a int primary key,
  3. b int,
  4. c int,
  5. d int,
  6. e int,
  7. unique key uk1(b,c),
  8. unique key uk2(c,d)
  9. Q1: select b,c from test where (b = 1 or b = 2) and (c = 1 or c =2)
  10. Q2: select * from test where (c = 1 or c =2) or (d = 1 or d = 2

Skyline剪枝规则

Skyline 算子是学术界在2001年提出的一个新的数据库算子(它并不是标准的 SQL 算子)。自此之后,学术界对 Skyline 算子有大量的研究(包括语法,语义和执行等)。Skyline 从字面上的理解是指天空中的一些边际点,这些点组成我们搜索空间中最优解的集合。例如我们要寻找价格最低并且路途最短的一家旅馆,想象一个二维空间,有两个维度,横轴表示价格,纵轴表示距离,二维空间上的每个点表示一个旅馆。从下图钟我们可以看到,不论最后的选择咋样,最优的解肯定是在这一条天空的边际线上。假设点 A 不在 Skyline 上,那么肯定能够在 Skyline 上找到在两个维度上都比他好的点 B,在这个场景中就是距离更近,价格更便宜的旅馆,我们称点 B dominate A。所以 Skyline 一个重要应用场景就是用户没办法去衡量多个维度的比重,或者多个维度不能综合量化(如果可以综合量化,我们可以使用 SQL 函数+ order by 就可以解决了)。

image

Skyline 操作是在给定对象集 O 中找出不被别的对象所 dominate 的对象集合。若一个对象 A 在所有维度都不被另一个对象 B 所 dominate,并且 A 至少在一个维度上 dominate B,则称 A dominate B。所以在 Skyline 操作中比较重要的是维度的选择以及在每个维度上的dominate的关系定义。对于优化器来讲,假设我们有N个索引的路径可以选择 <idx_1,idx_2,idx_3…idx_n>,如果我们发现对于查询 Q,索引 idx_x 在我们定义的维度上 dominate idx_y。那我们就可以提前把索引idx_y 剪掉,不让它参与最终代价的运算。

维度的定义

针对 Skyline 剪枝,我们对每个索引(主键也是一种索引)定义了如下三个维度:

  • 是否回表

  • 是否存在 intersting order

  • 索引前缀能否抽取 query range

如下例所示:

  1. create table skyline(
  2. pk int primary key, a int, b int, c int,
  3. key idx_a_b(a, b),
  4. key idx_b_c(b, c),
  5. key idx_c_a(c, a));
  • 回表: 该查询是否需要需要回查主表。
  1. // 走索引idx_a_b的话就需要回查主表,因为索引idx_a_b没有列c。
  2. select /*+index(skyline idx_a_b)*/ * from skyline;
  • interesting order: 是否有合适的序可以利用。
  1. // 索引 idx_b_c 可以把order by语句消除。
  2. select pk, b from skyline order by b;
  • 索引前缀能否抽取 query range。
  1. //可以看到走索引idx_c_a 就可以快速定位到需要的行的范围,不用全表扫描。
  2. select pk, b from skyline where c > 100 and c < 2000;

基于这三个维度,定义了索引之间的 dominate 关系,如果索引 A 在三个维度上都不比索引 B 差,并且其中至少有一个维度比 B 好,那么就可以直接把 B 索引剪掉,因为基于索引 B 最后生成的计划肯定不会比索引 A 好。

  • 如果索引 idx_A 不需要回表,而索引 idx_B需要回表,那么在这个维度上索引 idx_A dominate idx_B。
  • 如果在索引 idx_A上抽取出来的 intersting order 是向量 Va<a1, a2, a3 …an>, 在索引idx_B上抽出来的interesting order 是向量Vb<b1, b2, b3…bm>, 如果 n > m , 并且对于ai = bi (i=1..m), 那么在这个维度上索引 idx_A dominate idx_B。
  • 如果在索引 idx_A 能用来抽取的 query range 的列集合是 Sa<a1, a2, a3 …an>, 在索引 idx_B 上能用来抽取 query range 的列集合是 Sb <b1, b2, b3…bm>, 如果 Sa 是 Sb 的 super set, 那么在这个维度上索引 idx_A dominate idx_B。

回表

这个维度初看比较简单,就是查询的需要列在索引中有没有。但是其实有一些有意思的案例需要特殊考虑,例如当主表和索引表都没有 Interesting order 和抽取不了 Query range 的情况下,直接走主表不一定是最优解。

  1. create table t1 (
  2. pk int primary key, a int, b int, c int,
  3. v1 varchar(1000), v2 varchar(1000), v3 varchar(1000), v4 varchar(1000)
  4. idx_a_b(a, b));
  5. //考虑这一条查询
  6. select a, b,c from t1 where b = 100;
索引Index BackInteresting OrderQuery Range
primarynonono
idx_a_byesnono

主表很宽,而索引表很窄,虽然从维度上主表 dominate 索引 idx_a_b,然而,索引扫描加回表的代价不一定会比主表全表扫描来的慢。简单来说,索引表可能只需要读一个宏块,而主表可能需要十个宏块。这种情况下,需要对规则做一些放宽,考虑具体的过滤条件。

Interesting order

Interesting Order 像是优化器“借力打力”的过程,只要能利用底层的序,那我就不需要对底层扫描的行做排序,还可以消除 Order by, 做 Merge group by,提高 Pipeline(不用物化)等。

  1. create table skyline (
  2. pk int primary key, v1 int, v2 int, v3 int, v4 int, v5 int,
  3. key idx_v1_v3_v5(v1, v3, v5),
  4. key idx_v3_v4(v3, v4));
  5. create table tmp (c1 int primary key, c2 int, c3 int);
  6. (select distinct v1, v3 from skyline join tmp where skyline.v1 = tmp.c1 order by v1, v3) union (select c1, c2 from tmp);

image

从执行计划我们可以看到,order by 被消除了,同时使用了 MERGE DISTINCT,UNION 也没有做 sort。可以看到,从底层 TABLE SCAN 吐出来的序,可以被上层的算子使用。换句话说,保留 idx_v1_v3_v5 吐出来的行的顺序,可以让后面的算子在保序的情况下执行更优的操作。优化器在识别这些序的情况下,才能生成更优的执行计划。

所以 Skyline 剪枝对 Interesting order 的判断,需要充分考虑各个索引能够最大利用的序,例如上述最大的序其实是 v1,v3 而不仅仅是 v1,它从 MERGE JOIN 吐出来的序(v1, v3) 可以到 MERGE DISINCT 算子, 再到最后的 UNISON DISTINCT 算子。优化器的“借力打力”的武功越高级,生成的计划就越好。

Query Range

Query Range 的抽取可以方便底层直接根据抽取出来的 range 定位到具体的宏块,而从减少存储层的 IO。例如 select * from t1 where pk < 100 and pk > 0 就可以直接根据一级索引的信息定位到具体的宏块,加速查询,越精确的 query range 能够让数据库扫描更少的行。

  1. create table t1 (pk int primary key, a int, b intc int,
  2. key idx_b_c(b, c),
  3. key idx_a_b(a, b));
  4. select b from t1 where a = 100 and b > 2000;

对于索引 idx_b_c 它能抽出 query range 的索引前缀是 (b),对于索引 idx_a_b 它能抽出 query range 的索引前缀是 (a, b),所以在这个维度上,索引 idx_a_b dominate idx_b_c。

综合举例

  1. create table skyline (
  2. pk int primary key, v1 int, v2 int, v3 int, v4 int, v5 int,
  3. key idx_v1_v3_v5(v1, v3, v5),
  4. key idx_v3_v4(v3, v4));
  5. create table tmp (c1 int primary key, c2 int, c3 int);
  6. select max(v5) from skyline where v1 = 100 and v3 > 200 group by v1;
索引Index BackInteresting orderQuery range
primaryNot needNoNo
idx_v1_v3_v5Not need(v1)(v1, v3)
idx_v3_v4NeedNo(v3)

可以看到索引 idx_v1_v3_v5 在三个维度上都不比主键索引或索引 idx_v3_v4 差。所以在规则系统下,会直接剪掉主键索引和索引 idx_v3_v4。维度的合理定义,决定了 Skyline 剪枝是否合理。错误的维度,将会导致该索引提前被剪掉,从而导致永远生成不了最优的计划。规则的应用是一把双刃剑,既要把不优的索引剪掉,更不能错杀。