TiDB 路线图

TiDB

优化器
- 统计信息优化
- Multi-Column Statistics
- Cascades Planner
- Plan Management
- SQL Tuning Advisor
- Robust Access Path Selection：增加启发式规则，提升 OLTP 场景中索引选择正确率
- Adaptive Query Optimization
执行引擎
- 算子并行化
- 内存控制
- 并发控制
- Shuffle 算子
- Vectorized 表达式计算
- UDF
SQL 功能
- 支持 View
- 支持窗口函数
- 支持 Common Table Expression
- 支持 Hash 分区表
- 支持 utf8_general_ci collation
DDL 改进
- 支持 Table Lock
- 支持 Change column type
- 支持单条语句中多个 DDL 操作
- 支持不可见索引（invisible index）
支持插件系统
- 支持白名单插件
- 支持审计日志插件
- 支持 RBAC 插件
- 支持诊断插件
支持 Query Tracing
支持行列混合存储引擎
支持 New Storage Row Format，提升性能并减小内存占用
RowID 实现非整数类型
事务
- 减少读写冲突
- 优化事务调度机制
- 改善模型，降低延迟
- 支持最小事务 (like the mini-transaction of InnoDB)

Raft
- Region Merge - 合并小的 Region 以减少开销
- Local Read Thread - 把读请求放在一个单独的线程处理
- 批量 Region Split - 加速大的 Region 的分裂
- Raft Learner - 支持 Raft learner 使得成员变更过程更加平滑
- Raft Pre-voter - 支持 Raft Pre-vote 避免网络隔离带来不必要的选举
- Joint Consensus - 安全地进行多个成员变更
- 多线程 Raftstore - 在多个线程处理不同 Region 的 Raft 逻辑
- 多线程 Apply Pool - 在多个线程执行不同 Region 已经提交了的命令
Engine
- Titan - 把大的 key-values 从 LSM-Tree 中分离出来
- 可拔插的 Engine 接口 - 简化接口逻辑并且提供可扩展性
Storage
- 在 scheduler 里做流控提前避免 write stall
Transaction
- 优化事务冲突
- 分布式 GC - 把 MVCC 垃圾回收的逻辑分布到 TiKV 控制
Coprocessor
- Streaming - 把大的数据集切成小块返回以减少内存消耗
- Chunk Execution - 按 chunk 的方式来处理数据以提高性能
- 请求跟踪 - 提供单个请求执行的详细信息
Tools
- TiKV Importer - 通过直接导入 SST 文件的方式加速数据导入
Client
- 提供 Rust 版本的 TiKV client
- gRPC 消息批量化 - 减少消息交互的开销

Limit/Order 下推
DAG 接口接入（废除 Select 接口）
Index Join 和并行 merge join
Data Federation（桥接其他数据源，最好能和社区同步，这个接进来可以比较好扩展 Usecase，如果再做一个 InputFormat 适配就可以接 Hive 和 Presto 这些 Hadoop 上的数仓）