自适应压缩

可获得性

本特性自openGauss 1.0.0版本开始引入。

特性简介

数据压缩是当前数据库采用的主要技术。数据类型不同,适用于它的压缩算法不同。对于相同类型的数据,其数据特征不同,采用不同的压缩算法达到的效果也不相同。自适应压缩正是从数据类型和数据特征出发,采用相应的压缩算法,实现了良好的压缩比、快速的入库性能以及良好的查询性能。

客户价值

数据入库和频繁的海量数据查询是用户的主要应用场景。 在数据入库场景中,自适应压缩可以大幅度地减少数据量,成倍提高IO操作效率,将数据簇集存储,从而获得快速的入库性能。当用户进行数据查询时,少量的IO操作和快速的数据解压可以加快数据获取的速率,从而在更短的时间内得到查询结果。

特性描述

目前,数据库已实现了列存储上RLE、DELTA、BYTEPACK/BITPACK、LZ4、ZLIB、LOCAL DICTIONARY等多种压缩算法。数据库支持的数据类型与压缩算法的映射关系如下表所示。

-

RLE

DELTA

BITPACK/BYTEPACK

LZ4

ZLIB

LOCAL DICTIONARY

Smallint/Int/Bigint/Oid

Decimal/Real/Double

Money/Time/Date/

Timestamp

-

Tinterval/Interval/Time with time zone/

-

-

-

-

-

Numeric/Char/Varchar/Text/Nvarchar2

以及其他支持数据类型

特性增强

支持对压缩算法进行不同压缩水平的调整。

特性约束

无。

依赖关系

开源压缩软件LZ4/ZLIB。