数据模型与技术

本节,我们以电力场景为例,说明如何在IoTDB中创建一个正确的数据模型。附件是一个样例数据文件,方便您练习IoTDB。

附件下载: IoTDB-SampleData.txt数据模型与技术 - 图1 (opens new window)

根据数据数据模型与技术 - 图2 (opens new window)的属性层级,属性涵盖范围以及数据之间的从属关系,我们可将其数据模型表示为如图2.1所示的属性层级组织结构,即电力集团层-电厂层-设备层-传感器层。其中ROOT为根节点,传感器层的每一个节点为叶子节点。IoTDB的语法规定,ROOT节点到叶子节点的路径以“.”连接,以此完整路径命名IoTDB中的一个时间序列。例如,图2.1最左侧路径对应的时间序列名称为ROOT.ln.wf01.wt01.status

数据模型与技术 - 图3

图2.1 属性层级组织结构

得到时间序列的名称之后,我们需要根据数据的实际场景和规模设置存储组。由于在本文所述场景中,每次到达的数据通常以集团为单位(即数据可能为跨电场、跨设备的),为了写入数据时避免频繁切换IO降低系统速度,且满足用户以集团为单位进行物理隔离数据的要求,我们将存储组设置在集团层。

根据模型结构,IoTDB中涉及如下基本概念:

  • 设备

设备指的是在实际场景中拥有传感器的装置。在IoTDB当中,所有的传感器都应有其对应的归属的设备。

  • 传感器

传感器是指在实际场景中的一种检测装置,它能感受到被测量的信息,并能将感受到的信息按一定规律变换成为电信号或其他所需形式的信息输出并发送给IoTDB。在IoTDB当中,存储的所有的数据及路径,都是以传感器为单位进行组织。

  • 存储组

用户可以将任意前缀路径设置成存储组。如有4条时间序列root.vehicle.d1.s1, root.vehicle.d1.s2, root.vehicle.d2.s1, root.vehicle.d2.s2,路径root.vehicle下的两个设备d1,d2可能属于同一个业主,或者同一个厂商,因此关系紧密。这时候就可以将前缀路径root.vehicle指定为一个存储组,这将使得IoTDB将其下的所有设备的数据存储在同一个文件夹下。未来root.vehicle下增加了新的设备,也将属于该存储组。

注意:不允许将一个完整路径(如上例的root.vehicle.d1.s1)设置成存储组。

设置合理数量的存储组可以带来性能的提升:既不会因为产生过多的存储文件(夹)导致频繁切换IO降低系统速度(并且会占用大量内存且出现频繁的内存-文件切换),也不会因为过少的存储文件夹(降低了并发度从而)导致写入命令阻塞。

用户应根据自己的数据规模和使用场景,平衡存储文件的存储组设置,以达到更好的系统性能。(未来会有官方提供的存储组规模与性能测试报告)

注意:一个时间序列其前缀必须属于某个存储组。在创建时间序列之前,用户必须设定该序列属于哪个存储组(Storage Group)。只有设置了存储组的时间序列才可以被持久化在磁盘上。

一个前缀路径一旦被设定成存储组后就不可以再更改这个存储组的设置。

一个存储组设定后,其对应的前缀路径的所有父层级与子层级也不允许再设置存储组(如,root.ln设置存储组后,root层级与root.ln.wf01不允许被设置为存储组)。

  • 路径

在IoTDB中,路径是指符合以下约束的表达式:

  1. path: LayerName (DOT LayerName)+
  2. LayerName: Identifier | STAR

其中STAR为“*”,DOT为“.”。

我们称一个路径中在两个“.”中间的部分叫做一个层级,则root.a.b.c为一个层级为4的路径。

值得说明的是,在路径中,root为一个保留字符,它只允许出现在下文提到的时间序列的开头,若其他层级出现root,则无法解析,提示报错。

在路径中,不允许使用单引号。如果你想在LayerName中使用“.”等特殊字符,请使用双引号。例如,root.sg."d.1"."s.1"。双引号内支持使用转义符进行双引号的嵌套,如 root.sg.d1."s.\"t\"1"

注意: storage group中的LayerName只支持数字,字母,和下划线。

  • 时间序列

时间序列是IoTDB中的核心概念。时间序列可以被看作产生时序数据的传感器的所在完整路径,在IoTDB中所有的时间序列必须以root开始、以传感器作为结尾。一个时间序列也可称为一个全路径。

例如,vehicle种类的device1有名为sensor1的传感器,则它的时间序列可以表示为:root.vehicle.device1.sensor1

注意:当前IoTDB支持的时间序列必须大于等于四层(之后会更改为两层)。

  • 前缀路径

前缀路径是指一个时间序列的前缀所在的路径,一个前缀路径包含以该路径为前缀的所有时间序列。例如当前我们有root.vehicle.device1.sensor1, root.vehicle.device1.sensor2, root.vehicle.device2.sensor1三个传感器,则root.vehicle.device1前缀路径包含root.vehicle.device1.sensor1root.vehicle.device1.sensor2两个时间序列,而不包含root.vehicle.device2.sensor1

  • 3.1.7 带*路径 为了使得在表达多个时间序列或表达前缀路径的时候更加方便快捷,IoTDB为用户提供带*路径。*可以出现在路径中的任何层。按照*出现的位置,带*路径可以分为两种:

*出现在路径的结尾;

*出现在路径的中间;

*出现在路径的结尾时,其代表的是(*)+,即为一层或多层*。例如root.vehicle.device1.*代表的是root.vehicle.device1.*, root.vehicle.device1.*.*, root.vehicle.device1.*.*.*等所有以root.vehicle.device1为前缀路径的大于等于4层的路径。

*出现在路径的中间,其代表的是*本身,即为一层。例如root.vehicle.*.sensor1代表的是以root.vehicle为前缀,以sensor1为后缀,层次等于4层的路径。

注意:*不能放在路径开头。

注意:*放在末尾时与前缀路径表意相同,例如root.vehicle.*root.vehicle为相同含义。

  • 时间戳

时间戳是一个数据到来的时间点,其中包括绝对时间戳和相对时间戳。

  • 绝对时间戳

IOTDB中绝对时间戳分为二种,一种为LONG类型,一种为DATETIME类型(包含DATETIME-INPUT, DATETIME-DISPLAY两个小类)。

在用户在输入时间戳时,可以使用LONG类型的时间戳或DATETIME-INPUT类型的时间戳,其中DATETIME-INPUT类型的时间戳支持格式如表所示:

**DATETIME-INPUT类型支持格式**

format
yyyy-MM-dd HH:mm:ss
yyyy/MM/dd HH:mm:ss
yyyy.MM.dd HH:mm:ss
yyyy-MM-dd’T’HH:mm:ss
yyyy/MM/dd’T’HH:mm:ss
yyyy.MM.dd’T’HH:mm:ss
yyyy-MM-dd HH:mm:ssZZ
yyyy/MM/dd HH:mm:ssZZ
yyyy.MM.dd HH:mm:ssZZ
yyyy-MM-dd’T’HH:mm:ssZZ
yyyy/MM/dd’T’HH:mm:ssZZ
yyyy.MM.dd’T’HH:mm:ssZZ
yyyy/MM/dd HH:mm:ss.SSS
yyyy-MM-dd HH:mm:ss.SSS
yyyy.MM.dd HH:mm:ss.SSS
yyyy/MM/dd’T’HH:mm:ss.SSS
yyyy-MM-dd’T’HH:mm:ss.SSS
yyyy.MM.dd’T’HH:mm:ss.SSS
yyyy-MM-dd HH:mm:ss.SSSZZ
yyyy/MM/dd HH:mm:ss.SSSZZ
yyyy.MM.dd HH:mm:ss.SSSZZ
yyyy-MM-dd’T’HH:mm:ss.SSSZZ
yyyy/MM/dd’T’HH:mm:ss.SSSZZ
yyyy.MM.dd’T’HH:mm:ss.SSSZZ
ISO8601 standard time format

IoTDB在显示时间戳时可以支持LONG类型以及DATETIME-DISPLAY类型,其中DATETIME-DISPLAY类型可以支持用户自定义时间格式。自定义时间格式的语法如表所示:

**DATETIME-DISPLAY自定义时间格式的语法**

SymbolMeaningPresentationExamples
Geraeraera
Ccentury of era (>=0)number20
Yyear of era (>=0)year1996
xweekyearyear1996
wweek of weekyearnumber27
eday of weeknumber2
Eday of weektextTuesday; Tue
yyearyear1996
Dday of yearnumber189
Mmonth of yearmonthJuly; Jul; 07
dday of monthnumber10
ahalfday of daytextPM
Khour of halfday (0~11)number0
hclockhour of halfday (1~12)number12
Hhour of day (0~23)number0
kclockhour of day (1~24)number24
mminute of hournumber30
ssecond of minutenumber55
Sfraction of secondmillis978
ztime zonetextPacific Standard Time; PST
Ztime zone offset/idzone-0800; -08:00; America/Los_Angeles
escape for textdelimiter
‘’single quoteliteral
  • 相对时间戳

    相对时间是指与服务器时间now()DATETIME类型时间相差一定时间间隔的时间。 形式化定义为:

    1. Duration = (Digit+ ('Y'|'MO'|'W'|'D'|'H'|'M'|'S'|'MS'|'US'|'NS'))+
    2. RelativeTime = (now() | DATETIME) ((+|-) Duration)+

    **The syntax of the duration unit**

    SymbolMeaningPresentationExamples
    yyear1y=365 days1y
    momonth1mo=30 days1mo
    wweek1w=7 days1w
    dday1d=1 day1d
    hhour1h=3600 seconds1h
    mminute1m=60 seconds1m
    ssecond1s=1 second1s
    msmillisecond1ms=1000_000 nanoseconds1ms
    usmicrosecond1us=1000 nanoseconds1us
    nsnanosecond1ns=1 nanosecond1ns

    例子:

    1. now() - 1d2h //比服务器时间早1天2小时的时间
    2. now() - 1w //比服务器时间早1周的时间

    注意:’+’和’—‘的左右两边必须有空格