数据模型选用与创建

在向IoTDB导入数据之前,首先要根据样例数据选择合适的数据存储模型,然后使用SET STORAGE GROUP语句和CREATE TIMESERIES语句设置存储组,并创建时间序列。

选用存储模型

根据本文描述的数据属性层级,按照属性涵盖范围以及它们之间的从属关系,我们可将其表示为如下图3.1的属性层级组织结构,其层级关系为:集团层-电场层-设备层-传感器层。其中ROOT为根节点,传感器层的每一个节点称为叶子节点。在使用IoTDB的过程中,您可以直接将由ROOT节点到每一个叶子节点路径上的属性用“.”连接,将其作为一个IoTDB的时间序列的名称。图3.1中最左侧的路径可以生成一个名为ROOT.ln.wf01.wt01.status的时间序列。

数据模型选用与创建 - 图1

**图3.1 属性层级组织结构**

得到时间序列的名称之后,我们需要根据数据的实际场景和规模设置存储组。由于在本文所述场景中,每次到达的数据通常以集团为单位(即数据可能为跨电场、跨设备的),为了写入数据时避免频繁切换IO降低系统速度,且满足用户以集团为单位进行物理隔离数据的要求,我们将存储组设置在集团层。

创建存储组

存储模型选用后,我们可以根据存储模型建立相应的存储组。创建存储组的SQL语句如下所示:

  1. IoTDB > set storage group to root.ln
  2. IoTDB > set storage group to root.sgcc

根据以上两条SQL语句,我们可以创建出两个存储组。

需要注意的是,当系统中已经存在某个存储组或存储组的父亲节点或者孩子节点被设置为存储组的情况下,用户不可创建存储组。例如在已经有root.lnroot.sgcc这两个存储组的情况下,创建root.ln.wf01存储组是不可行的。系统将给出相应的错误提示,如下所示:

  1. IoTDB> set storage group to root.ln.wf01
  2. Msg: org.apache.iotdb.exception.MetadataErrorException: org.apache.iotdb.exception.PathErrorException: The prefix of root.ln.wf01 has been set to the storage group.

查看存储组

在存储组创建后,我们可以使用SHOW STORAGE GROUP语句来查看所有的存储组,SQL语句如下所示:

  1. IoTDB> show storage group

执行结果为:

数据模型选用与创建 - 图2

创建时间序列

根据建立的数据模型,我们可以分别在两个存储组中创建相应的时间序列。创建时间序列的SQL语句如下所示:

  1. IoTDB > create timeseries root.ln.wf01.wt01.status with datatype=BOOLEAN,encoding=PLAIN
  2. IoTDB > create timeseries root.ln.wf01.wt01.temperature with datatype=FLOAT,encoding=RLE
  3. IoTDB > create timeseries root.ln.wf02.wt02.hardware with datatype=TEXT,encoding=PLAIN
  4. IoTDB > create timeseries root.ln.wf02.wt02.status with datatype=BOOLEAN,encoding=PLAIN
  5. IoTDB > create timeseries root.sgcc.wf03.wt01.status with datatype=BOOLEAN,encoding=PLAIN
  6. IoTDB > create timeseries root.sgcc.wf03.wt01.temperature with datatype=FLOAT,encoding=RLE

需要注意的是,当创建时间序列时指定的编码方式与数据类型不对应时,系统会给出相应的错误提示,如下所示:

  1. IoTDB> create timeseries root.ln.wf02.wt02.status WITH DATATYPE=BOOLEAN, ENCODING=TS_2DIFF
  2. error: encoding TS_2DIFF does not support BOOLEAN

详细的数据类型与编码方式的对应列表请参见编码方式

查看时间序列

目前,IoTDB支持两种查看时间序列的方式:

  • SHOW TIMESERIES语句以JSON形式展示系统中所有的时间序列信息

  • SHOW TIMESERIES <Path>语句以表格的形式返回给定路径的下的所有时间序列信息及时间序列总数。时间序列信息具体包括:时间序列路径名,数据类型,编码类型。其中,Path需要为一个前缀路径、带星路径或时间序列路径。例如,分别查看root路径和root.ln路径下的时间序列,SQL语句如下所示:

  1. IoTDB> show timeseries root
  2. IoTDB> show timeseries root.ln

执行结果分别为:

数据模型选用与创建 - 图3

数据模型选用与创建 - 图4

需要注意的是,当查询路径不存在时,系统会返回0条时间序列。

注意事项

0.8.2版本对用户操作的数据规模进行一些限制:

限制1:假设运行时IoTDB分配到的JVM内存大小为p,用户自定义的每次将内存中的数据写入到磁盘时的大小(group_size_in_byte)为q。存储组的数量不能超过p/q。

限制2:时间序列的数量不超过运行时IoTDB分配到的JVM内存与20KB的比值。