DDL (数据定义语言)

创建存储组

我们可以根据存储模型建立相应的存储组。创建存储组的SQL语句如下所示:

  1. IoTDB > set storage group to root.ln
  2. IoTDB > set storage group to root.sgcc

根据以上两条SQL语句,我们可以创建出两个存储组。

需要注意的是,当系统中已经存在某个存储组或存储组的父亲节点或者孩子节点被设置为存储组的情况下,用户不可创建存储组。例如在已经有root.lnroot.sgcc这两个存储组的情况下,创建root.ln.wf01存储组是不可行的。系统将给出相应的错误提示,如下所示:

  1. IoTDB> set storage group to root.ln.wf01
  2. Msg: org.apache.iotdb.exception.MetadataException: org.apache.iotdb.exception.MetadataException: The prefix of root.ln.wf01 has been set to the storage group.

查看存储组

在存储组创建后,我们可以使用SHOW STORAGE GROUP语句和SHOW STORAGE GROUP <PrefixPath>来查看存储组,SQL语句如下所示:

  1. IoTDB> show storage group
  2. IoTDB> show storage group root.ln

执行结果为:

DDL (数据定义语言) - 图1

删除存储组

用户可以使用DELETE STORAGE GROUP <PrefixPath>语句删除该前缀路径下所有的存储组。在删除的过程中,需要注意的是存储组的数据也会被删除。

  1. IoTDB > DELETE STORAGE GROUP root.ln
  2. IoTDB > DELETE STORAGE GROUP root.sgcc
  3. // 删除所有数据,时间序列以及存储组
  4. IoTDB > DELETE STORAGE GROUP root.*

创建时间序列

根据建立的数据模型,我们可以分别在两个存储组中创建相应的时间序列。创建时间序列的SQL语句如下所示:

  1. IoTDB > create timeseries root.ln.wf01.wt01.status with datatype=BOOLEAN,encoding=PLAIN
  2. IoTDB > create timeseries root.ln.wf01.wt01.temperature with datatype=FLOAT,encoding=RLE
  3. IoTDB > create timeseries root.ln.wf02.wt02.hardware with datatype=TEXT,encoding=PLAIN
  4. IoTDB > create timeseries root.ln.wf02.wt02.status with datatype=BOOLEAN,encoding=PLAIN
  5. IoTDB > create timeseries root.sgcc.wf03.wt01.status with datatype=BOOLEAN,encoding=PLAIN
  6. IoTDB > create timeseries root.sgcc.wf03.wt01.temperature with datatype=FLOAT,encoding=RLE

需要注意的是,当创建时间序列时指定的编码方式与数据类型不对应时,系统会给出相应的错误提示,如下所示:

  1. IoTDB> create timeseries root.ln.wf02.wt02.status WITH DATATYPE=BOOLEAN, ENCODING=TS_2DIFF
  2. error: encoding TS_2DIFF does not support BOOLEAN

详细的数据类型与编码方式的对应列表请参见编码方式

标签点管理

我们可以在创建时间序列的时候,为它添加别名和额外的标签和属性信息。 所用到的扩展的创建时间序列的SQL语句如下所示:

  1. create timeseries root.turbine.d1.s1(temprature) with datatype=FLOAT, encoding=RLE, compression=SNAPPY tags(tag1=v1, tag2=v2) attributes(attr1=v1, attr2=v2)

括号里的tempratures1这个传感器的别名。 我们可以在任何用到s1的地方,将其用temprature代替,这两者是等价的。

IoTDB 同时支持在查询语句中使用AS函数设置别名。二者的区别在于:AS 函数设置的别名用于替代整条时间序列名,且是临时的,不与时间序列绑定;而上文中的别名只作为传感器的别名,与其绑定且可与原传感器名等价使用。

标签和属性的唯一差别在于,我们为标签信息在内存中维护了一个倒排索引,所以可以在show timeseries的条件语句中使用标签作为查询条件,你将会在下一节看到具体查询内容。

注意:额外的标签和属性信息总的大小不能超过tag_attribute_total_size.

标签点属性更新

创建时间序列后,我们也可以对其原有的标签点属性进行更新,主要有以下五种更新方式:

  • 重命名标签或属性
  1. ALTER timeseries root.turbine.d1.s1 RENAME tag1 TO newTag1
  • 重新设置标签或属性的值
  1. ALTER timeseries root.turbine.d1.s1 SET tag1=newV1, attr1=newV1
  • 删除已经存在的标签或属性
  1. ALTER timeseries root.turbine.d1.s1 DROP tag1, tag2
  • 添加新的标签
  1. ALTER timeseries root.turbine.d1.s1 ADD TAGS tag3=v3, tag4=v4
  • 添加新的属性
  1. ALTER timeseries root.turbine.d1.s1 ADD ATTRIBUTES attr3=v3, attr4=v4
  • 更新插入别名,标签和属性

如果该别名,标签或属性原来不存在,则插入,否则,用新值更新原来的旧值

  1. ALTER timeseries root.turbine.d1.s1 UPSERT ALIAS=newAlias TAGS(tag2=newV2, tag3=v3) ATTRIBUTES(attr3=v3, attr4=v4)

查看时间序列

  • SHOW LATEST? TIMESERIES prefixPath? showWhereClause? limitClause?

    SHOW TIMESERIES 中可以有四种可选的子句,查询结果为这些时间序列的所有信息

时间序列信息具体包括:时间序列路径名,存储组,Measurement别名,数据类型,编码方式,压缩方式,属性和标签。

示例:

  • SHOW TIMESERIES

    展示系统中所有的时间序列信息

  • SHOW TIMESERIES <Path>

    返回给定路径的下的所有时间序列信息。其中 Path 需要为一个前缀路径、带星路径或时间序列路径。例如,分别查看root路径和root.ln路径下的时间序列,SQL语句如下所示:

  1. IoTDB> show timeseries root
  2. IoTDB> show timeseries root.ln

执行结果分别为:

DDL (数据定义语言) - 图2

DDL (数据定义语言) - 图3

  • SHOW TIMESERIES (<PrefixPath>)? WhereClause

    返回给定路径的下的所有满足条件的时间序列信息,SQL语句如下所示:

  1. show timeseries root.ln where unit=c
  2. show timeseries root.ln where description contains 'test1'

执行结果分别为:

DDL (数据定义语言) - 图4

注意,现在我们只支持一个查询条件,要么是等值条件查询,要么是包含条件查询。当然where子句中涉及的必须是标签值,而不能是属性值。

  • SHOW TIMESERIES LIMIT INT OFFSET INT

    只返回从指定下标开始的结果,最大返回条数被 LIMIT 限制,用于分页查询

  • SHOW LATEST TIMESERIES

    表示查询出的时间序列需要按照最近插入时间戳降序排列

需要注意的是,当查询路径不存在时,系统会返回0条时间序列。

查看子路径

  1. SHOW CHILD PATHS prefixPath

可以查看此前缀路径的下一层的所有路径,前缀路径允许使用 * 通配符。

示例:

  • 查询 root.ln 的下一层:show child paths root.ln
  1. +------------+
  2. | child paths|
  3. +------------+
  4. |root.ln.wf01|
  5. |root.ln.wf02|
  6. +------------+
  • 查询形如 root.xx.xx.xx 的路径:show child paths root.*.*
  1. +---------------+
  2. | child paths|
  3. +---------------+
  4. |root.ln.wf01.s1|
  5. |root.ln.wf02.s2|
  6. +---------------+

统计时间序列总数

IoTDB支持使用COUNT TIMESERIES<Path>来统计一条路径中的时间序列个数。SQL语句如下所示:

  1. IoTDB > COUNT TIMESERIES root
  2. IoTDB > COUNT TIMESERIES root.ln
  3. IoTDB > COUNT TIMESERIES root.ln.*.*.status
  4. IoTDB > COUNT TIMESERIES root.ln.wf01.wt01.status

除此之外,还可以通过定义LEVEL来统计指定层级下的时间序列个数。这条语句可以用来统计每一个设备下的传感器数量,语法为:COUNT TIMESERIES <Path> GROUP BY LEVEL=<INTEGER>

例如有如下时间序列(可以使用show timeseries展示所有时间序列):

DDL (数据定义语言) - 图5

那么Metadata Tree如下所示:

DDL (数据定义语言) - 图6

可以看到,root被定义为LEVEL=0。那么当你输入如下语句时:

  1. IoTDB > COUNT TIMESERIES root GROUP BY LEVEL=1
  2. IoTDB > COUNT TIMESERIES root.ln GROUP BY LEVEL=2
  3. IoTDB > COUNT TIMESERIES root.ln.wf01 GROUP BY LEVEL=2

你将得到以下结果:

DDL (数据定义语言) - 图7

注意:时间序列的路径只是过滤条件,与level的定义无关。

统计节点数

IoTDB支持使用COUNT NODES <PrefixPath> LEVEL=<INTEGER>来统计当前Metadata树下指定层级的节点个数,这条语句可以用来统计设备数。例如:

  1. IoTDB > COUNT NODES root LEVEL=2
  2. IoTDB > COUNT NODES root.ln LEVEL=2
  3. IoTDB > COUNT NODES root.ln.wf01 LEVEL=3

对于上面提到的例子和Metadata Tree,你可以获得如下结果:

DDL (数据定义语言) - 图8

注意:时间序列的路径只是过滤条件,与level的定义无关。 其中PrefixPath可以包含*,但是*及其后的所有节点将被忽略,仅在*前的前缀路径有效。

删除时间序列

我们可以使用DELETE TimeSeries <PrefixPath>语句来删除我们之前创建的时间序列。SQL语句如下所示:

  1. IoTDB> delete timeseries root.ln.wf01.wt01.status
  2. IoTDB> delete timeseries root.ln.wf01.wt01.temperature, root.ln.wf02.wt02.hardware
  3. IoTDB> delete timeseries root.ln.wf02.*

查看设备

Show Timeseries 相似,IoTDB 目前也支持两种方式查看设备。

  • SHOW DEVICES 语句显示当前所有的设备信息,等价于 SHOW DEVICES root
  • SHOW DEVICES <PrefixPath> 语句规定了 PrefixPath,返回在给定的前缀路径下的设备信息。

SQL语句如下所示:

  1. IoTDB> show devices
  2. IoTDB> show devices root.ln

TTL

IoTDB支持对存储组级别设置数据存活时间(TTL),这使得IoTDB可以定期、自动地删除一定时间之前的数据。合理使用TTL 可以帮助您控制IoTDB占用的总磁盘空间以避免出现磁盘写满等异常。并且,随着文件数量的增多,查询性能往往随之下降, 内存占用也会有所提高。及时地删除一些较老的文件有助于使查询性能维持在一个较高的水平和减少内存资源的占用。

设置 TTL

设置TTL的SQL语句如下所示:

  1. IoTDB> set ttl to root.ln 3600000

这个例子表示在root.ln存储组中,只有最近一个小时的数据将会保存,旧数据会被移除或不可见。

取消 TTL

取消TTL的SQL语句如下所示:

  1. IoTDB> unset ttl to root.ln

取消设置TTL后,存储组root.ln中所有的数据都会被保存。

显示 TTL

显示TTL的SQL语句如下所示:

  1. IoTDB> SHOW ALL TTL
  2. IoTDB> SHOW TTL ON StorageGroupNames

SHOW ALL TTL这个例子会给出所有存储组的TTL。 SHOW TTL ON root.group1,root.group2,root.group3这个例子会显示指定的三个存储组的TTL。 注意: 没有设置TTL的存储组的TTL将显示为null。

FLUSH

将指定存储组的内存缓存区Memory Table的数据持久化到磁盘上,并将数据文件封口。

  1. IoTDB> FLUSH
  2. IoTDB> FLUSH root.ln
  3. IoTDB> FLUSH root.sg1,root.sg2

MERGE

合并顺序和乱序数据。当前IoTDB支持使用如下两种SQL手动触发数据文件的合并:

  • MERGE 仅重写重复的Chunk,整理速度快,但是最终磁盘会存在多余数据。
  • FULL MERGE 将需要合并的顺序和乱序文件的所有数据都重新写一份,整理速度慢,最终磁盘将不存在无用的数据。
  1. IoTDB> MERGE
  2. IoTDB> FULL MERGE

CLEAR CACHE

手动清除chunk, chunk metadata和timeseries metadata的缓存,在内存资源紧张时,可以通过此命令,释放查询时缓存所占的内存空间。

  1. IoTDB> CLEAR CACHE

为 SCHEMA 创建快照

为了加快 IoTDB 重启速度,用户可以手动触发创建 schema 的快照,从而避免服务器从 mlog 文件中恢复。

  1. IoTDB> CREATE SNAPSHOT FOR SCHEMA