选择表存储模型

Greenplum数据库支持多种存储模型和一种混合存储模型。 当用户创建一个表时,用户会选择如何存储它的数据。 这个主题解释了表存储的选项以及如何为用户的负载选择最好的存储模型。

Note: 为了简化数据库表的创建,用户可以使用Greenplum数据库的服务器配置参数gp_default_storage_options为一些表存储选项指定默认值。

更多有关该参数的信息,请见Greenplum数据库参考指南中的“服务器配置参数”部分。

Parent topic: 定义数据库对象

堆存储

默认情况下,Greenplum数据库使用和PostgreSQL相同的堆存储模型。 堆表存储在OLTP类型负载下表现最好,这种环境中数据会在初始载入后被频繁地修改。 UPDATE和DELETE操作要求存储行级版本信息来确保可靠的数据库事务处理。 堆表最适合于较小的表,例如维度表,它们在初始载入数据后会经常被更新。

追加优化存储

追加优化表存储在数据仓库环境中的非规范表表现最好。 非规范表通常是系统中最大的表。 事实表通常成批地被载入并且被只读查询访问。 将大型的事实表改为追加优化存储模型可以消除每行中的更新可见性信息负担,这可以为每一行节约大概20字节。 这可以得到一种更加简洁并且更容易优化的页面结构。 追加优化表的存储模型是为批量数据装载优化的,因此不推荐单行的INSERT语句。

创建一个堆表

面向行的堆表是默认的存储类型。

  1. => CREATE TABLE foo (a int, b text) DISTRIBUTED BY (a);

使用CREATE TABLE命令的WITH子句可以声明表的存储选项。 默认是将表创建为面向行的堆存储表。 例如,要创建一个不压缩的追加优化表:

  1. => CREATE TABLE bar (a int, b text)
  2. WITH (appendoptimized=true)
  3. DISTRIBUTED BY (a);

Note: 使用appendoptimized=value语法来指定追加优化类型的表存储。 appendoptimized是appendonly传统存储选项的精简别名。 Greenplum数据库在catalog里存储appendonly,并在列出追加优化表的存储选项时显示相同的内容。

在一个可重复读或可序列化事务中的追加优化表上不允许UPDATE和DELETE,它们将导致该事务中止。 追加优化表上不支持CLUSTER、DECLARE…FOR UPDATE和触发器。

选择面向行或者面向列的存储

Greenplum提供面向存储的模型选择:行,列或两者的组合。 本主题提供了为表选择最佳存储的一般准则。 使用您自己的数据和查询工作负载评估性能。

  • 面向行的存储:适用于具有许多迭代事务的OLTP类型的工作负载以及一次需要多列的单行,因此检索是高效的。
  • 面向列的存储:适合于在少量列上计算数据聚集的数据仓库负载,或者是用于需要对单列定期更新但不修改其他列数据的情况。

对于大部分常用目的或者混合负载,面向行的存储提供了灵活性和性能的最佳组合。 不过,也有场景中面向列的存储模型提供了更高效的I/O和存储。 在为一个表决定存储方向模型时,请考虑下列需求:

  • 表数据的更新。如果用户会频繁地装载和更新表数据,请选择一个面向行的堆表。 面向列的表存储只能用于追加优化表。

    参考堆存储获得更多信息。

  • 频繁的插入。如果频繁地向表中插入行,请考虑面向行的模型。 列存表并未对写操作优化,因为一行的列值必须被写到磁盘上的不同位置。

  • 查询中要求的列数。如果在查询的SELECT列表或者WHERE子句中常常要求所有或者大部分列,请考虑面向行的模型。 面向列的表最适合的情况是,查询会聚集一个单一列中的很多值且WHERE或者HAVING谓词也在该聚集列上。例如:

    1. SELECT SUM(salary)...
    1. SELECT AVG(salary)... WHERE salary > 10000

    或者面向列的情况是WHERE谓词在一个单一列上并且返回相对较少的行。例如:

    1. SELECT salary, dept ... WHERE state='CA'
  • 表中的列数。在同时要求很多列或者表的行尺寸相对较小时,面向行的存储会更有效。 对于具有很多列的表且查询中访问这些列的一个小子集时,面向列的表能够提供更好的查询性能。

  • 压缩。列数据具有相同的数据类型,因此在列存数据上支持存储尺寸优化,但在行存数据上则不支持。 例如,很多压缩方案使用临近数据的相似性来进行压缩。 不过,临近压缩做得越好,随机访问就会越困难,因为必须解压数据才能读取它们。

创建一个面向列的表

CREATE TABLE命令的WITH子句指定表的存储选项。 默认是面向行的堆表。使用面向列的存储的表必须是追加优化表。 例如,要创建一个列存表:

  1. => CREATE TABLE bar (a int, b text)
  2. WITH (appendoptimized=true, orientation=column)
  3. DISTRIBUTED BY (a);

使用压缩(只适用于追加优化表)

对于追加优化表,在Greenplum数据库中有两种类型的库内压缩可用:

  • 应用于一整个表的表级压缩。
  • 应用到一个指定列的列级压缩。用户可以为不同的列应用不同的列级压缩算法。

下面的表总结了可用的压缩算法。

Table 1. 用于追加优化表的压缩算法
表方向可用的压缩类型支持的算法
ZLIB, ZSTDQUICKLZ1
列和表RLE_TYPE, ZLIB, ZSTDQUICKLZ1

Note: 1QuickLZ压缩在Greenplum数据库的开源版本中不可用。

在为追加优化表选择一种压缩类型和级别时,要考虑这些因素:

  • CPU使用。用户的Segment系统必须具有可用的CPU能力来压缩和解压数据。
  • 压缩率/磁盘尺寸。最小化磁盘尺寸是一个因素,但也要考虑压缩和扫描数据所需的时间和CPU计算能力。 要找到能高效压缩数据但不导致过长压缩时间或者过慢扫描率的最优设置。
  • 压缩的速度。与zlib比较,QuickLZ在较低的压缩率下通常使用较少的CPU计算能力、能更快地压缩数据。 zlib提供更高的压缩率,但是速度较慢。

    例如,在压缩级别1上(compresslevel=1),QuickLZ和zlib具有差不多的压缩率,但是压缩速度不同。 使用compresslevel=6的zlib能比QuickLZ更显著地提升压缩率,但是压缩速度更慢。 ZStandard压缩可以提供良好的压缩比或速度,具体取决于压缩级别,或两者的良好折衷。

  • 解压速度/扫描率。压缩的追加优化表的性能取决于硬件、查询调优设置和其他因素。 请执行对比测试来判断在用户的环境中的真实性能。

    Note: 不要在使用压缩的文件系统上创建压缩的追加优化表。 如果用户的Segment数据目录所在的文件系统是一个压缩的文件系统,用户的追加优化表不能使用压缩。

压缩的追加优化表的性能取决于硬件、查询调优设置和其他因素。 请执行对比测试来判断在用户的环境中的真实性能。

Note: Zstd压缩级别可以设置为1-19。 QuickLZ的压缩级别只能被设置为级别1,没有其他的选项可用。 zlib的压缩级别可以设置为1-9的值。 RLE的压缩级别可以设置为1-4的值。

ENCODING子句指定个别列的压缩类型和级别。 当ENCODING子句与WITH子句冲突时,ENCODING子句的优先级高于WITH子句。

创建一个压缩表

CREATE TABLE命令的WITH子句声明表的存储选项。 使用压缩技术的表必须是追加优化表。 例如,要创建一个使用zlib压缩且压缩级别为5的追加优化表:

  1. => CREATE TABLE foo (a int, b text)
  2. WITH (appendoptimized=true, compresstype=zlib, compresslevel=5);

检查追加优化表的压缩和分布

Greenplum提供了内建函数来检查一个追加优化表的压缩率和分布情况。 这些函数要求对象ID或者表名作为参数。用户可以用schema名来限定表名。

Table 2. 用于压缩追加优化表元数据的函数
函数返回类型描述
get_ao_distribution(name)

get_ao_distribution(oid)

(dbid, tuplecount)行的集合展示一个追加优化表的行在阵列中的分布情况。 返回一个行集合,其中每一个行包括了一个节点dbid以及存储在其中的元组数。
get_ao_compression_ratio(name)

get_ao_compression_ratio(oid)

float8为一个压缩的追加优化表计算压缩率。如果该信息不可用,这个函数会返回-1。

压缩比作为公共比率返回。 例如,返回值3.19或者3.19:1表示解压后的表比压缩表的尺寸的3倍略大。

表的分布被返回为一个行集合,它们反映了每个Segment上存储了多少元组。 例如,在一个具有四个Primary Segment(dbid值从0-3)的系统中,该函数返回与以下类似的四个行:

  1. =# SELECT get_ao_distribution('lineitem_comp');
  2. get_ao_distribution
  3. ---------------------
  4. (0,7500721)
  5. (1,7501365)
  6. (2,7499978)
  7. (3,7497731)
  8. (4 rows)

游程编码支持

Greenplum数据库对列级压缩支持游程编码(RLE)。 RLE数据压缩把重复的数据存储为一个单一的数据值和一个计数。 例如,在有两个列date和description的表中,它包含200,000个含有值date1的项以及400,000个含有值date2的项, 对这个date域的RLE压缩会类似于date1 200000 date2 400000。 RLE对于没有大量重复数据集合的文件来说用处不大,因为它会大幅度增加这种文件的尺寸。

有四种级别的RLE压缩可用。这些级别逐步增加了压缩率,但是同时也会降低压缩速度。

Greenplum数据库4.2.1及其后的版本支持面向列的RLE压缩。 如果要备份一个用了RLE压缩的表用来恢复到一个早期版本的Greenplum数据库中, 应在开始备份操作前修改该表为不采用压缩或者采用早期版本中支持的压缩类型(ZLIB或者QUICKLZ)。

Greenplum数据库为BIGINT、INTEGER、DATE、TIME或者TIMESTAMP列中的数据的RLE压缩结合了增量压缩。 该增量压缩算法基于连续列值之间的变化来进行压缩,它的设计目的是在以排序顺序装载数据时或者对已排序数据应用压缩时改进压缩性能。

增加列级压缩

用户可以为列存追加优化表的列增加下列存储指令:

  • 压缩类型
  • 压缩级别
  • 列的块尺寸

使用CREATE TABLE、ALTER TABLE以及CREATE TYPE命令增加存储指令。

下面的表格详细介绍了存储指令的类型以及每一个指令可能的值。

Table 3. 列级压缩的存储指令
名称定义注释
compresstype压缩的类型。zstd: ZStandard算法

zlib: 缩小算法

quicklz: 快速算法

RLE_TYPE: 游程编码

none: 无压缩

值不区分大小写。
compresslevel压缩级别。zlib压缩: 1-91是最快的方法但压缩率最低。1是默认值。

9是最慢的方法但压缩率最高。

zstd压缩: 1-191是最快的方法但压缩率最低。1是默认值。

19是最慢的方法但压缩率最高。

QuickLZ压缩:

1 – 使用压缩

1是默认值。
RLE_TYPE压缩:14

1 - 只应用RLE

2 - 应用RLE然后应用zlib压缩级别1

3 - 应用RLE然后应用zlib压缩级别5

4 - 应用RLE然后应用zlib压缩级别9

1是最快的方法但压缩率最低。

4是最慢的方法但压缩率最高。 1是默认值。

blocksize表中每一块的以字节计的尺寸8192 – 2097152该值必须是8192的倍数。

下面是增加存储指令的格式。

  1. [ ENCODING ( storage_directive [,…] ) ]

其中单词ENCODING是必需的并且存储指令有三个部分:

  • 指令的名称
  • 一个等号
  • 参数

多个存储指令用逗号分隔。 如下面的CREATE TABLE子句所示,可以把一个存储指令应用到单一列或者把它作为所有列的默认指令。

一般用法:

  1. column_name data_type ENCODING ( storage_directive [, ] ),
  1. COLUMN column_name ENCODING ( storage_directive [, ] ),
  1. DEFAULT COLUMN ENCODING ( storage_directive [, ] )

示例:

  1. C1 char ENCODING (compresstype=quicklz, blocksize=65536)
  1. COLUMN C1 ENCODING (compresstype=zlib, compresslevel=6, blocksize=65536)
  1. DEFAULT COLUMN ENCODING (compresstype=quicklz)

默认压缩值

如果没有定义压缩类型、压缩级别和块尺寸,默认是无压缩并且块尺寸被设置为服务器配置参数block_size。

压缩设置的优先级

列压缩设置从表级继承到分区级,再到子分区级。最低级别上的设置优先。

  • 表级定义的列压缩设置会覆盖该类型的任何压缩设置。
  • 表级指定的列压缩设置会覆盖整个表的任何压缩设置。
  • 为分区指定的列压缩设置会覆盖列级或表级别的任何压缩设置。
  • 为子分区指定的列压缩设置会覆盖分区,列或表级别的任何压缩设置。
  • 当ENCODING子句与WITH子句冲突时, ENCODING子句的优先级高于WITH子句。

Note: 在一个含有存储指令或者列引用存储指令的表中不允许INHERITS子句。

使用LIKE子句创建的表忽略存储指令以及列引用存储指令。

列压缩设置的最佳位置

最佳做法是在数据所在的层次上设置列压缩设置。 参考例 5,它展示了一个分区深度为2的表。 RLE_TYPE压缩在子分区层次上被增加到一个列。

存储指令示例

下面的例子展示了在CREATE TABLE语句中存储指令的使用。

例 1

在这个例子中,列c1被使用zstd压缩并且使用系统中定义的块尺寸。 列c2用quicklz压缩并且使用的块尺寸为65536。 列c3没有被压缩并且使用系统中定义的块尺寸。

  1. CREATE TABLE T1 (c1 int ENCODING (compresstype=zstd),
  2. c2 char ENCODING (compresstype=quicklz, blocksize=65536),
  3. c3 char) WITH (appendoptimized=true, orientation=column);

例 2

在这个例子中,列c1使用zlib压缩并且使用系统中定义的块尺寸。 列c2使用quicklz压缩,并且使用的块尺寸为65536。 列c3使用RLE_TYPE压缩并且使用系统中定义的块尺寸。

  1. CREATE TABLE T2 (c1 int ENCODING (compresstype=zlib),
  2. c2 char ENCODING (compresstype=quicklz, blocksize=65536),
  3. c3 char,
  4. COLUMN c3 ENCODING (compresstype=RLE_TYPE)
  5. )
  6. WITH (appendoptimized=true, orientation=column);

例 3

在这个例子中,列c1使用zlib压缩并且使用系统中定义的块尺寸。 列c2使用quicklz压缩,并且使用的块尺寸为65536。 列c3使用zlib压缩并且使用系统中定义的块尺寸。 注意,列c3在分区中使用zlib(而不是RLE_TYPE),因为在分区子句中的列存储比表的列定义中的存储指令优先级高。

  1. CREATE TABLE T3 (c1 int ENCODING (compresstype=zlib),
  2. c2 char ENCODING (compresstype=quicklz, blocksize=65536),
  3. c3 text, COLUMN c3 ENCODING (compresstype=RLE_TYPE) )
  4. WITH (appendoptimized=true, orientation=column)
  5. PARTITION BY RANGE (c3) (START ('1900-01-01'::DATE)
  6. END ('2100-12-31'::DATE),
  7. COLUMN c3 ENCODING (compresstype=zlib));

例 4

在这个例子中,CREATE TABLE把zlib压缩类型存储指令分配给c1。 列c2没有存储指令并且从DEFAULT COLUMN ENCODING子句继承了压缩类型(quicklz)和块尺寸(65536)。

列c3的ENCODING子句定义其压缩类型RLE_TYPE。 为特定列定义的ENCODING子句会覆盖DEFAULT ENCODING子句,因此列c3使用默认块大小32768。

列c4的压缩类型为none,并使用默认块大小。

  1. CREATE TABLE T4 (c1 int ENCODING (compresstype=zlib),
  2. c2 char,
  3. c3 text,
  4. c4 smallint ENCODING (compresstype=none),
  5. DEFAULT COLUMN ENCODING (compresstype=quicklz,
  6. blocksize=65536),
  7. COLUMN c3 ENCODING (compresstype=RLE_TYPE)
  8. )
  9. WITH (appendoptimized=true, orientation=column);

例 5

这个例子创建一个追加优化的列存表T5。 T5有两个分区p1和p2,每一个都有子分区。 每一个子分区都有ENCODING子句:

  • 分区p1的子分区sp1的ENCODING子句定义了列i的压缩类型是zlib并且块尺寸是65536。
  • 分区p2的子分区sp1的ENCODING子句定义了列i的压缩类型是rle_type并且块尺寸为默认值。 列k使用默认压缩并且其块尺寸为8192。

    1. CREATE TABLE T5(i int, j int, k int, l int)
    2. WITH (appendoptimized=true, orientation=column)
    3. PARTITION BY range(i) SUBPARTITION BY range(j)
    4. (
    5. partition p1 start(1) end(2)
    6. ( subpartition sp1 start(1) end(2)
    7. column i encoding(compresstype=zlib, blocksize=65536)
    8. ),
    9. partition p2 start(2) end(3)
    10. ( subpartition sp1 start(1) end(2)
    11. column i encoding(compresstype=rle_type)
    12. column k encoding(blocksize=8192)
    13. )
    14. );

用ALTER TABLE命令把一个压缩列增加到现有表的例子,请见为表增加一个压缩列

在TYPE命令中增加压缩

创建新类型时,可以为该类型定义默认压缩属性。 例如,以下CREATE TYPE命令定义了一个名为int33的类型,它指定了quicklz压缩:

  1. CREATE TYPE int33 (
  2. internallength = 4,
  3. input = int33_in,
  4. output = int33_out,
  5. alignment = int4,
  6. default = 123,
  7. passedbyvalue,
  8. compresstype="quicklz",
  9. blocksize=65536,
  10. compresslevel=1
  11. );

在CREATE TABLE命令中将int33指定为列类型时,将使用您为该类型指定的存储指令创建该列:

  1. CREATE TABLE t2 (c1 int33)
  2. WITH (appendoptimized=true, orientation=column);

您在表定义中指定的表级或列级存储属性会覆盖类型级存储属性。 有关为类型创建和添加压缩属性的信息,请参阅CREATE TYPE。 有关更改类型中的压缩规范的信息,请参阅ALTER TYPE

选择块尺寸

blocksize是一个表中每一块的尺寸,以字节计。 块尺寸必须介于8192字节和2097152字节之间,并且必须是8192的倍数。默认是32768。

指定大的块尺寸可能会消耗大量的内存。 块大小决定了存储层中的缓存。 在面向列的表中,Greenplum维护为每个分区每个列维护了一个缓存。 具有许多分区或列的表占用大量内存。

修改一个表

ALTER TABLE命令改变一个表的定义。 使用ALTER TABLE可以更改表的属性,例如列定义、分布策略、存储模型以及分区结构(另见维护分区表)。 例如,为一个表列增加一个非空约束:

  1. => ALTER TABLE address ALTER COLUMN street SET NOT NULL;

修改表的分布

ALTER TABLE提供了选项来改变一个表的分布策略。 当表分布选项改变时,表数据会被在磁盘上重新分布,这可能会造成资源紧张。 用户也可以使用现有的分布策略重新分布表数据。

更改分布策略

对于已分区的表,对于分布策略的更改会递归地应用到子分区上。 这种操作会保留拥有关系和该表的所有其他属性。 例如,下列命令使用customer_id列作为分布键在所有Segment之间重新分布表sales:

  1. ALTER TABLE sales SET DISTRIBUTED BY (customer_id);

在用户改变一个表的哈希分布时,表数据会被自动重新分布。 把分布策略改成随机分布不会导致数据被重新分布。 例如,下面的ALTER TABLE命令不会立刻产生效果:

  1. ALTER TABLE sales SET DISTRIBUTED RANDOMLY;

将表的分布策略更改为DISTRIBUTED REPLICATED或从DISTRIBUTED REPLICATED修改为其他分布,会自动重新分配表数据。

重新分布表的数据

要用一种随机分布策略(或者当哈希分布策略没有被更改时)对表重新分布数据,可使用REORGANIZE=TRUE。 重新组织数据对于更正一个数据倾斜问题是必要的,当系统中增加了Segment资源后也需要重新组织数据。 例如,下面的命令会使用当前的分布策略(包括随机分布)在所有Segment上重新分布数据。

  1. ALTER TABLE sales SET WITH (REORGANIZE=TRUE);

将表的分布策略更改为DISTRIBUTED REPLICATED或从DISTRIBUTED REPLICATED改为其它总是重新分配表数据, 即使REORGANIZE=FALSE也是如此。

修改表的存储模型

表存储、压缩和行列类型只能在创建时声明。 要改变存储模型,用户必须用正确的存储选项创建一个表,再把原始表的数据载入到新表中,接着删除原始表并且把新表重命名为原始表的名称。 用户还必须重新授权原始表上有的权限。例如:

  1. CREATE TABLE sales2 (LIKE sales)
  2. WITH (appendoptimized=true, compresstype=quicklz,
  3. compresslevel=1, orientation=column);
  4. INSERT INTO sales2 SELECT * FROM sales;
  5. DROP TABLE sales;
  6. ALTER TABLE sales2 RENAME TO sales;
  7. GRANT ALL PRIVILEGES ON sales TO admin;
  8. GRANT SELECT ON sales TO guest;

可参考分裂分区来学习如何改表一个已分区表的存储模型。

为表增加一个压缩列

使用ALTER TABLE命令为一个表增加一个压缩列。 所有在增加列级压缩中描述的用于压缩列的选项和约束都适用于用ALTER TABLE命令增加的列。

下面的例子展示了如何向一个表中增加一个使用zlib压缩的列T1。

  1. ALTER TABLE T1
  2. ADD COLUMN c4 int DEFAULT 0
  3. ENCODING (compresstype=zlib);

压缩设置的继承

如果一个表有子分区且子分区带有压缩设置,则向该表增加的一个分区会从子分区继承那些压缩设置。 下面的例子展示了如何创建一个有子分区编码的表,然后修改它来增加一个分区。

  1. CREATE TABLE ccddl (i int, j int, k int, l int)
  2. WITH
  3. (appendoptimized = TRUE, orientation=COLUMN)
  4. PARTITION BY range(j)
  5. SUBPARTITION BY list (k)
  6. SUBPARTITION template(
  7. SUBPARTITION sp1 values(1, 2, 3, 4, 5),
  8. COLUMN i ENCODING(compresstype=ZLIB),
  9. COLUMN j ENCODING(compresstype=QUICKLZ),
  10. COLUMN k ENCODING(compresstype=ZLIB),
  11. COLUMN l ENCODING(compresstype=ZLIB))
  12. (PARTITION p1 START(1) END(10),
  13. PARTITION p2 START(10) END(20))
  14. ;
  15. ALTER TABLE ccddl
  16. ADD PARTITION p3 START(20) END(30)
  17. ;

运行ALTER TABLE命令会创建表ccddl的名为ccddl_1_prt_p3和ccddl_1_prt_p3_2_prt_sp1的分区。 分区ccddl_1_prt_p3继承了子分区sp1的不同的压缩编码。

删除一个表

DROP TABLE命令把表从数据库中移除。例如:

  1. DROP TABLE mytable;

要清空一个表的行但不移除该表的定义,可使用DELETE或者TRUNCATE。例如:

  1. DELETE FROM mytable;
  2. TRUNCATE mytable;

DROP TABLE总是会移除目标表上存在的任何索引、规则、触发器和约束。 删除一个被视图引用的表应指定CASCADE。CASCADE会移除依赖表的视图。