创建次级索引

什么是次级索引

在非主键上标识的索引,次级索引也称为非聚集索引(non-clustered index),用于提高查询性能和加速数据检索。次级索引并不直接存储表数据,而是对数据的一部分(如某个列)建立索引,从而允许数据库系统快速定位表中包含特定值的行。

使用次级索引可以帮助加速查询操作,特别是在对大型表进行查询时。次级索引还可以用于支持排序、分组和连接操作,这些操作通常需要对表中的一部分数据进行排序或者匹配。

开始前准备

在阅读本页面之前,你需要准备以下事项:

  • 了解并已经完成构建 MatrixOne 集群。
  • 了解什么是数据库模式

使用次级索引

创建次级索引有两种方式,一种是在建表的时候就建立 KEY 次级索引,另一种可以在建表后通过 CREATE INDEX 或者 ALTER TABLE ADD index 语句动态创建次级索引,指定索引所针对的列以及其他索引选项。

语法结构分别为:

  1. CREATE TABLE table_name (
  2. col1 int primary key,
  3. col2 int,
  4. KEY index_name (col2) );
  5. CREATE INDEX index_name ON table_name (column_name);
  6. ALTER TABLE ADD INDEX index_name ON table_name (column_name);

其中,index_name 是索引的名称,table_name 是要在其上创建索引的表格名称,而 column_name 是用于创建索引的列名。

例如,如果要在名为 employees 的表格的 last_name 列上创建一个次级索引,可以使用以下 SQL 语句:

  1. CREATE INDEX idx_lastname ON employees (last_name);

使用次级索引:可以在查询语句中使用次级索引来定位数据行。SQL 查询优化器会自动选择合适的索引来执行查询操作,以获得最佳性能。如:

  1. SELECT * FROM employees WHERE last_name = 'Smith';

在这个例子中,查询优化器会使用 idx_lastname 索引来定位 last_nameSmith 的数据行。

需要注意的是,创建索引会增加数据库的存储和维护成本,并且在插入、更新和删除数据时也可能会影响性能。因此,在创建次级索引时需要仔细考虑其对数据库性能的影响,并进行必要的优化和调整。

SQL 示例

  1. CREATE TABLE users (id INT PRIMARY KEY,
  2. name VARCHAR(50),
  3. age INT,
  4. email VARCHAR(50)
  5. );
  6. -- 我们可以在表格上创建一个次级索引来加快按名字查询用户的速度
  7. CREATE INDEX idx_users_name ON users(name);
  8. -- 插入一些数据
  9. INSERT INTO users VALUES ('1', 'John', '30', 'john@gmail.com');
  10. INSERT INTO users VALUES ('2', 'Tommy', '50', 'tom@gmail.com');
  11. INSERT INTO users VALUES ('3', 'Ann', '33', 'ann@gmail.com');
  12. -- 执行如下查询,数据库可以使用次级索引来快速地查找所有名字为“John”的用户,而不必扫描整个表格。
  13. mysql> SELECT * FROM users WHERE name = 'John';
  14. +------+------+------+----------------+
  15. | id | name | age | email |
  16. +------+------+------+----------------+
  17. | 1 | John | 30 | john@gmail.com |
  18. +------+------+------+----------------+
  19. 1 row in set (0.00 sec)

复合次级索引

MatrixOne 也支持复合次级索引,即在两个或更多列上创建的索引。它允许在一个索引中包含多个列,从而优化涉及这些列的查询。

对于跨多个列的查询,复合索引可以大幅提高查询性能。它们在执行排序和过滤任务时特别有效,尤其是当这些操作涉及到多个字段时。如果查询只涉及索引中的列,数据库可以直接从索引中获取数据,而无需访问表中的行,这可以大大提高查询效率。

复合次级索引使用注意事项:

  1. 列的顺序:在复合索引中,列的顺序非常重要。数据库在查找时会按照索引定义中列的顺序进行。
  2. 高基数:高基数的列(即具有许多唯一值的列)应该放在索引的前面。
  3. 写入性能影响:虽然读取操作可以受益于复合索引,但是它们可能会降低写入操作的性能,因为索引需要在插入或更新数据时更新。

SQL 示例

假设有一个订单表 orders,其中包含 customer_id, order_date, 和 status 列。为了优化涉及这些列的查询,可以创建一个复合索引:

  1. CREATE INDEX idx_customer_date_status ON orders(customer_id, order_date, status);

在这个例子中,如果有基于 customer_idorder_date 的查询,这个复合索引会非常有用。然而,如果查询只涉及 order_date,这个复合索引可能不会被有效利用,因为 order_date 不是索引中的第一个列。

限制

  1. MatrixOne 暂时不支持 Online DDL。动态创建次级索引,无论是 ALTER TABLE ADD INDEX 还是 CREATE INDEX 都会导致原表上锁,其他事务的 DML 操作会被阻塞 (INSERT, UPDATE,DELETE, SELECT FOR UPDATE)。

  2. MatrixOne 目前不支持 FULLTEXT 及 SPATIAL 索引。