GROUP BY

SQL 中的 GROUP BY 语句用于对具有一个或多个列中的相同值的行进行分组。 该子句通常与聚合函数(如 COUNTSUMAVG 等)一起使用,以生成汇总报表。

Syntax

GROUP BY 的基本语法如下:

  1. SELECT column1, column2, ..., aggregate_function(column_name)
  2. FROM table_name
  3. GROUP BY column1, column2, ...;

GROUP BY 语句根据子句中指定的列对结果集进行分组。 聚合函数应用于具有相同值的组。

示例

假设有如下名为 system_metrics 的表:

  1. +-------+-------+----------+-------------+-----------+---------------------+
  2. | host | idc | cpu_util | memory_util | disk_util | ts |
  3. +-------+-------+----------+-------------+-----------+---------------------+
  4. | host1 | idc_a | 11.8 | 10.3 | 10.3 | 2022-11-03 03:39:57 |
  5. | host1 | idc_b | 50 | 66.7 | 40.6 | 2022-11-03 03:39:57 |
  6. | host1 | idc_c | 50.1 | 66.8 | 40.8 | 2022-11-03 03:39:57 |
  7. | host1 | idc_e | NULL | 66.7 | 40.6 | 2022-11-03 03:39:57 |
  8. | host2 | idc_a | 80.1 | 70.3 | 90 | 2022-11-03 03:39:57 |
  9. +-------+-------+----------+-------------+-----------+---------------------+

根据 Tags 聚合

要获取每个 idc 中的 memory_util 平均值,可以使用以下 SQL:

  1. SELECT idc, AVG(memory_util)
  2. FROM system_metrics
  3. GROUP BY idc;

结果如下:

  1. +-------+---------------------------------+
  2. | idc | AVG(system_metrics.memory_util) |
  3. +-------+---------------------------------+
  4. | idc_b | 66.7 |
  5. | idc_c | 66.8 |
  6. | idc_e | 66.7 |
  7. | idc_a | 40.3 |
  8. +-------+---------------------------------+

根据 Time Interval 聚合

要获取 memory_util 的日均值,SQL 如下:

  1. SELECT date_trunc('day', ts) as dt, avg(memory_util)
  2. FROM system_metrics
  3. GROUP BY dt

请参考 date_trunc 获取更多信息。