概述
更新数据
使用相同的 tag 和 time index 更新数据
更新操作可以通过插入操作来实现。 如果某行数据具有相同的 tag 和 time index,旧数据将被新数据替换,这意味着你只能更新 field 类型的列。 想要更新数据,只需使用与现有数据相同的 tag 和 time index 插入新数据即可。
有关列类型的更多信息,请参阅数据模型。
注意
尽管更新操作的性能与插入数据相同,过多的更新可能会对查询性能产生负面影响。
更新表中的所有字段
在更新数据时,默认情况下所有字段都将被新值覆盖, 而 InfluxDB 行协议 除外,它只会更新表中的部分字段。 以下示例使用 SQL 演示了更新表中所有字段的行为。
假设你有一个名为 monitor
的表,具有以下 schema。 host
列表示 tag,ts
列表示 time index。
CREATE TABLE monitor (
host STRING,
ts TIMESTAMP DEFAULT CURRENT_TIMESTAMP() TIME INDEX,
cpu FLOAT64,
memory FLOAT64,
PRIMARY KEY(host)
);
向 monitor
表中插入一行新数据:
INSERT INTO monitor (host, ts, cpu, memory)
VALUES ("127.0.0.1", "2024-07-11 20:00:00", 0.8, 0.1);
检查表中的数据:
SELECT * FROM monitor;
+-----------+---------------------+------+--------+
| host | ts | cpu | memory |
+-----------+---------------------+------+--------+
| 127.0.0.1 | 2024-07-11 20:00:00 | 0.8 | 0.1 |
+-----------+---------------------+------+--------+
1 row in set (0.00 sec)
要更新数据,你可以使用与现有数据相同的 host
和 ts
值,并将新的 cpu
值设置为 0.5
:
INSERT INTO monitor (host, ts, cpu, memory)
-- 与现有数据相同的标签 `127.0.0.1` 和相同的时间索引 2024-07-11 20:00:00
VALUES ("127.0.0.1", "2024-07-11 20:00:00", 0.5, 0.1);
新数据将为:
SELECT * FROM monitor;
+-----------+---------------------+------+--------+
| host | ts | cpu | memory |
+-----------+---------------------+------+--------+
| 127.0.0.1 | 2024-07-11 20:00:00 | 0.5 | 0.1 |
+-----------+---------------------+------+--------+
1 row in set (0.01 sec)
当使用默认的合并策略时, 如果在 INSERT INTO
语句中省略了某列, 它们将被默认值覆盖。
例如:
INSERT INTO monitor (host, ts, cpu)
VALUES ("127.0.0.1", "2024-07-11 20:00:00", 0.5);
monitor
表中 memory
列的默认值为 NULL
。因此,新数据将为:
SELECT * FROM monitor;
+-----------+---------------------+------+--------+
| host | ts | cpu | memory |
+-----------+---------------------+------+--------+
| 127.0.0.1 | 2024-07-11 20:00:00 | 0.5 | NULL |
+-----------+---------------------+------+--------+
1 row in set (0.01 sec)
更新表中的部分字段
默认情况下, InfluxDB 行协议 支持此种更新策略。 你还可以使用 SQL 在创建表时通过指定 merge_mode
选项为 last_non_null
来启用此行为。 示例如下:
CREATE TABLE monitor (
host STRING,
ts TIMESTAMP DEFAULT CURRENT_TIMESTAMP() TIME INDEX,
cpu FLOAT64,
memory FLOAT64,
PRIMARY KEY(host)
) WITH ('merge_mode'='last_non_null');
INSERT INTO monitor (host, ts, cpu, memory)
VALUES ("127.0.0.1", "2024-07-11 20:00:00", 0.8, 0.1);
要更新 monitor
表中的特定字段, 你可以只插入带有要更新的字段的新数据。 例如:
INSERT INTO monitor (host, ts, cpu)
VALUES ("127.0.0.1", "2024-07-11 20:00:00", 0.5);
这将更新 cpu
字段,同时保持 memory
字段不变。 结果将为:
+-----------+---------------------+------+--------+
| host | ts | cpu | memory |
+-----------+---------------------+------+--------+
| 127.0.0.1 | 2024-07-11 20:00:00 | 0.5 | 0.1 |
+-----------+---------------------+------+--------+
请注意, last_non_null
无法将旧值更新为 NULL
。 例如:
INSERT INTO monitor (host, ts, cpu, memory)
VALUES ("127.0.0.1", "2024-07-11 20:00:01", 0.8, 0.1);
INSERT INTO monitor (host, ts, cpu)
VALUES ("127.0.0.1", "2024-07-11 20:00:01", NULL);
不会更新任何内容:
+-----------+---------------------+------+--------+
| host | ts | cpu | memory |
+-----------+---------------------+------+--------+
| 127.0.0.1 | 2024-07-11 20:00:01 | 0.8 | 0.1 |
+-----------+---------------------+------+--------+
有关 merge_mode
选项的更多信息,请参阅 CREATE TABLE 语句。
通过创建带有 append_mode
选项的表来避免更新数据
在创建表时,GreptimeDB 支持 append_mode
选项,该选项始终将新数据插入表中。 当你想要保留所有历史数据(例如日志)时十分有用。
你只能使用 SQL 创建带有 append_mode
选项的表。 成功创建表后,所有写入数据的协议都将在表中始终插入新数据。
例如,你可以创建一个带有 append_mode
选项的 app_logs
表,如下所示。 host
和 log_level
列表示 tag,ts
列表示 time index。
CREATE TABLE app_logs (
ts TIMESTAMP TIME INDEX,
host STRING,
api_path STRING FULLTEXT,
log_level STRING,
log STRING FULLTEXT,
PRIMARY KEY (host, log_level)
) WITH ('append_mode'='true');
向 app_logs
表中插入一行新数据:
INSERT INTO app_logs (ts, host, api_path, log_level, log)
VALUES ('2024-07-11 20:00:10', 'host1', '/api/v1/resource', 'ERROR', 'Connection timeout');
检查表中的数据:
SELECT * FROM app_logs;
输出将为:
+---------------------+-------+------------------+-----------+--------------------+
| ts | host | api_path | log_level | log |
+---------------------+-------+------------------+-----------+--------------------+
| 2024-07-11 20:00:10 | host1 | /api/v1/resource | ERROR | Connection timeout |
+---------------------+-------+------------------+-----------+--------------------+
1 row in set (0.01 sec)
你可以插入具有相同 tag 和 time index 的新数据:
INSERT INTO app_logs (ts, host, api_path, log_level, log)
-- 与现有数据相同的标签 `host1` 和 `ERROR`,相同的时间索引 2024-07-11 20:00:10
VALUES ('2024-07-11 20:00:10', 'host1', '/api/v1/resource', 'ERROR', 'Connection reset');
然后,你将在表中找到两行数据:
SELECT * FROM app_logs;
+---------------------+-------+------------------+-----------+--------------------+
| ts | host | api_path | log_level | log |
+---------------------+-------+------------------+-----------+--------------------+
| 2024-07-11 20:00:10 | host1 | /api/v1/resource | ERROR | Connection reset |
| 2024-07-11 20:00:10 | host1 | /api/v1/resource | ERROR | Connection timeout |
+---------------------+-------+------------------+-----------+--------------------+
2 rows in set (0.01 sec)
删除数据
你可以通过指定 tag 和 time index 来有效地删除数据。 未指定 tag 和 time index 进行删除数据不高效,因为它需要两个步骤:查询数据,然后按 tag 和 time index 进行删除。 有关列类型的更多信息,请参阅数据模型。
警告
过多的删除可能会对查询性能产生负面影响。
只能使用 SQL 删除数据。 例如,要从 monitor
表中删除具有 tag host
和 time index ts
的行:
DELETE FROM monitor WHERE host='127.0.0.2' AND ts=1667446798450;
输出将为:
Query OK, 1 row affected (0.00 sec)
有关 DELETE
语句的更多信息,请参阅 SQL DELETE。
删除表中的所有数据
要删除表中的所有数据,可以使用 SQL 中的 TRUNCATE TABLE
语句。 例如,要清空 monitor
表:
TRUNCATE TABLE monitor;
有关 TRUNCATE TABLE
语句的更多信息,请参阅 SQL TRUNCATE TABLE 文档。
使用 TTL 策略保留数据
Time to Live (TTL) 允许你设置定期删除表中数据的策略, 你可以使用 TTL 自动删除数据库中的过期数据。 设置 TTL 策略具有以下好处:
- 通过清理过期数据来降低存储成本。
- 减少数据库在某些查询中需要扫描的行数,从而提高查询性能。
你可以在创建每个表时设置 TTL。 例如,以下 SQL 语句创建了一个名为 monitor
的表,并设置了 7 天的 TTL 策略:
CREATE TABLE monitor (
host STRING,
ts TIMESTAMP DEFAULT CURRENT_TIMESTAMP() TIME INDEX,
cpu FLOAT64,
memory FLOAT64,
PRIMARY KEY(host)
) WITH ('ttl'='7d');
你还可以创建数据库级别的 TTL 策略。 例如,以下 SQL 语句创建了一个名为 test
的数据库,并设置了 7 天的 TTL 策略:
CREATE DATABASE test WITH ('ttl'='7d');
你可以同时为 table 和 database 设置 TTL 策略。 如果 table 有自己的 TTL 策略,则该策略将优先于 database 的 TTL 策略, 否则 database 的 TTL 策略将被应用于 table。
有关 TTL 策略的更多信息,请参阅 CREATE 语句。