数据类型 - DECIMAL - 《Apache Doris v2.0 中文文档》

DECIMAL

DECIMAL

SinceVersion 1.2.1

DECIMAL

description

DECIMAL(M[,D])
高精度定点数，M 代表一共有多少个有效数字(precision)，D 代表小数位有多少数字(scale)，
有效数字 M 的范围是 [1, 38]，小数位数字数量 D 的范围是 [0, precision]。
默认值为 DECIMAL(9, 0)。

精度推演

DECIMAL有一套很复杂的类型推演规则，针对不同的表达式，会应用不同规则进行精度推断。

四则运算

加法 / 减法：DECIMAL(a, b) + DECIMAL(x, y) -> DECIMAL(max(a - b, x - y) + max(b, y) + 1, max(b, y))。
乘法：DECIMAL(a, b) + DECIMAL(x, y) -> DECIMAL(a + x, b + y)。
除法：DECIMAL(p1, s1) + DECIMAL(p2, s2) -> DECIMAL(p1 + s2 + div_precision_increment, s1 + div_precision_increment)。div_precision_increment 默认为4。值得注意的是，除法计算的过程是 DECIMAL(p1, s1) / DECIMAL(p2, s2) 先转换成 DECIMAL(p1 + s2 + div_precision_increment, s1 + s2 ) / DECIMAL(p2, s2) 然后再进行计算，所以可能会出现 DECIMAL(p1 + s2 + div_precision_increment, s1 + div_precision_increment) 是满足DECIMAL的范围，但是由于先转换成了DECIMAL(p1 + s2 + div_precision_increment, s1 + s2 ) 导致超出范围，目前Doris的处理是转成Double进行计算

聚合运算

SUM / MULTI_DISTINCT_SUM：SUM(DECIMAL(a, b)) -> DECIMAL(38, b)。
AVG：AVG(DECIMAL(a, b)) -> DECIMAL(38, max(b, 4))。

默认规则

除上述提到的函数外，其余表达式都使用默认规则进行精度推演。即对于表达式 expr(DECIMAL(a, b))，结果类型同样也是DECIMAL(a, b)。

调整结果精度

不同用户对DECIMAL的精度要求各不相同，上述规则为当前Doris的默认行为，如果用户有不同的精度需求，可以通过以下方式进行精度调整：

如果期望的结果精度大于默认精度，可以通过调整入参精度来调整结果精度。例如用户期望计算AVG(col)得到DECIMAL(x, y)作为结果，其中col的类型为DECIMAL(a, b)，则可以改写表达式为AVG(CAST(col as DECIMAL(x, y)))。
如果期望的结果精度小于默认精度，可以通过对输出结果求近似得到想要的精度。例如用户期望计算AVG(col)得到DECIMAL(x, y)作为结果，其中col的类型为DECIMAL(a, b)，则可以改写表达式为ROUND(AVG(col), y)。

为什么需要DECIMAL

Doris中的DECIMAL是真正意义上的高精度定点数，Decimal有以下核心优势：

可表示范围更大。DECIMAL中precision和scale的取值范围都进行了明显扩充。
性能更高。老版本的DECIMAL在内存中需要占用16 bytes，在存储中占用12 bytes，而DECIMAL进行了自适应调整（如下表格）。

+----------------------+-------------------+
|     precision        | 占用空间（内存/磁盘）|
+----------------------+-------------------+
| 0 < precision <= 9   |      4 bytes      |
+----------------------+-------------------+
| 9 < precision <= 18  |      8 bytes      |
+----------------------+-------------------+
| 18 < precision <= 38 |     16 bytes      |
+----------------------+-------------------+

更完备的精度推演。对于不同的表达式，应用不同的精度推演规则对结果的精度进行推演。

keywords

DECIMAL