问题描述

bug 触发条件如下:

  1. 优化器先选择了 where 条件中字段的索引,该索引过滤性较好;
  2. SQL 中必须有 order by limit 从而引导优化器尝试使用 order by 字段上的索引进行优化,最终因代价问题没有成功。

复现case

表结构

  1. create table t1(
  2. id int auto_increment primary key,
  3. a int, b int, c int,
  4. key iabc (a, b, c),
  5. key ic (c)
  6. ) engine = innodb;

构造数据

  1. insert into t1 select null,null,null,null;
  2. insert into t1 select null,null,null,null from t1;
  3. insert into t1 select null,null,null,null from t1;
  4. insert into t1 select null,null,null,null from t1;
  5. insert into t1 select null,null,null,null from t1;
  6. insert into t1 select null,null,null,null from t1;
  7. update t1 set a = id / 2, b = id / 4, c = 6 - id / 8;

触发SQL

  1. mysql> explain select id from t1 where a<3 and b in (1, 13) and c>=3 order by c limit 2\G
  2. *************************** 1. row ***************************
  3. id: 1
  4. select_type: SIMPLE
  5. table: t1
  6. type: index
  7. possible_keys: iabc,ic
  8. key: iabc
  9. key_len: 15
  10. ref: NULL
  11. rows: 32
  12. Extra: Using where; Using index; Using filesort

使用 force index 可以选择过滤性好的索引

  1. mysql> explain select id from t1 force index(iabc) where a<3 and b in (1, 13) and c>=3 order by c limit 2\G
  2. *************************** 1. row ***************************
  3. id: 1
  4. select_type: SIMPLE
  5. table: t1
  6. type: range
  7. possible_keys: iabc
  8. key: iabc
  9. key_len: 5
  10. ref: NULL
  11. rows: 3
  12. Extra: Using where; Using index; Using filesort

问题分析

optimizer_trace 可以帮助分析这个问题。

SELECT * FROM INFORMATION_SCHEMA.OPTIMIZER_TRACE\G

  1. "range_scan_alternatives": [
  2. {
  3. "index": "iabc",
  4. "ranges": [
  5. "NULL < a < 3"
  6. ],
  7. "index_dives_for_eq_ranges": true,
  8. "rowid_ordered": false,
  9. "using_mrr": false,
  10. "index_only": true,
  11. "rows": 3,
  12. "cost": 1.6146,
  13. "chosen": true
  14. },
  15. {
  16. "index": "ic",
  17. "ranges": [
  18. "3 <= c"
  19. ],
  20. "index_dives_for_eq_ranges": true,
  21. "rowid_ordered": false,
  22. "using_mrr": false,
  23. "index_only": false,
  24. "rows": 17,
  25. "cost": 21.41,
  26. "chosen": false,
  27. "cause": "cost"
  28. }
  29. ],

range_scan_alternatives 计算 range_scan,各个索引的开销,从上面的结果可以看出,联合索引 iabc 开销较小,应该选择 iabc。

  1. "considered_execution_plans": [
  2. {
  3. "plan_prefix": [
  4. ],
  5. "table": "`t1`",
  6. "best_access_path": {
  7. "considered_access_paths": [
  8. {
  9. "access_type": "range",
  10. "rows": 3,
  11. "cost": 2.2146,
  12. "chosen": true
  13. }
  14. ]
  15. },
  16. "cost_for_plan": 2.2146,
  17. "rows_for_plan": 3,
  18. "chosen": true
  19. }
  20. ]

considered_execution_plans 表索引选择过程,access_type 是 range,rows_for_plan=3,到这里为止,执行计划还是符合预期的。

  1. {
  2. "clause_processing": {
  3. "clause": "ORDER BY",
  4. "original_clause": "`t1`.`c`",
  5. "items": [
  6. {
  7. "item": "`t1`.`c`"
  8. }
  9. ],
  10. "resulting_clause_is_simple": true,
  11. "resulting_clause": "`t1`.`c`"
  12. }
  13. },
  14. {
  15. "refine_plan": [
  16. {
  17. "table": "`t1`",
  18. "access_type": "index_scan"
  19. }
  20. ]
  21. },
  22. {
  23. "reconsidering_access_paths_for_index_ordering": {
  24. "clause": "ORDER BY",
  25. "index_order_summary": {
  26. "table": "`t1`",
  27. "index_provides_order": false,
  28. "order_direction": "undefined",
  29. "index": "unknown",
  30. "plan_changed": false
  31. }
  32. }
  33. }

clause_processing 用于简化 order by,经过 clause_processing access_type 变成 index_scan(全索引扫描,过滤性较range差),此时出现了和预期不符的结果。

因此可以推测优化器试图优化 order by 时出现了错误:

  • 第一阶段,优化器选择了索引 iabc,采用 range 访问;
  • 第二阶段,优化器试图进一步优化执行计划,使用 order by 的列访问,并清空了第一阶段的结果;
  • 第三阶段,优化器发现使用 order by 的列访问,代价比第一阶段的结果更大,但是第一阶段结果已经被清空了,无法还原,于是选择了代价较大的访问方式(index_scan),触发了bug。

问题解决

  1. 我们在索引优化函数SQL_SELECT::test_quick_select 最开始的时候保存访问计划变量(quick);
  2. 在索引没变的时候,还原这个变量;
  3. 在索引发生改变的时候,删除这个变量。

在不修改 mysql 源码的情况下,可以通过 force index 强制指定索引规避这个bug。

SQL_SELECT::test_quick_select 调用栈如下

  1. #0 SQL_SELECT::test_quick_select
  2. #1 make_join_select
  3. #2 JOIN::optimize
  4. #3 mysql_execute_select
  5. #4 mysql_select
  6. #5 mysql_explain_unit
  7. #6 explain_query_expression
  8. #7 execute_sqlcom_select
  9. #8 mysql_execute_command
  10. #9 mysql_parse
  11. #10 dispatch_command
  12. #11 do_command