集群设置

你可以根据此文档启动IoTDB集群。

安装环境

为使用IoTDB,你首先需要:

  1. 安装前需要保证设备上配有 JDK>=1.8 的运行环境,并配置好 JAVA_HOME 环境变量。

  2. 设置最大文件打开数为 65535。

安装步骤

IoTDB 支持多种安装途径。用户可以使用三种方式对 IoTDB 进行安装——下载二进制可运行程序、使用源码、使用 docker 镜像。

源码编译

下载源码:

  1. git clone https://github.com/apache/iotdb.git

默认分支为master分支,你可以切换到其他发布版本,例如:

  1. git checkout rel/0.12

在iotdb根目录下:

  1. > mvn clean package -pl cluster -am -DskipTests

集群的二进制版本在目录 cluster/target/{iotdb-project.version}

下载

你可以直接下载二进制版本 Download Page集群搭建 - 图2 (opens new window)

文件目录

完成IoTDB Cluster安装后,默认会在IoTDB Cluster的根目录下生成下列目录文件:

目录说明
conf配置文件目录
data默认数据文件目录,可通过修改配置文件修改位置
ext默认udf目录,可通过修改配置文件修改位置
lib库文件目录
logs运行日志目录
sbin可执行文件目录
tools系统工具目录

配置

为方便 IoTDB Server 的配置与管理,IoTDB Server 为用户提供三种配置项,使得您可以在启动服务或服务运行时对其进行配置。

三种配置项的配置文件均位于 IoTDB 安装目录:$IOTDB_HOME/conf文件夹下,其中涉及 server 配置的共有 4 个文件,分别为:iotdb-cluster.propertiesiotdb-engine.propertieslogback.xmliotdb-env.sh(Unix 系统)/iotdb-env.bat(Windows 系统), 您可以通过更改其中的配置项对系统运行的相关配置项进行配置。

配置文件的说明如下:

  • iotdb-env.sh/iotdb-env.bat:环境配置项的默认配置文件。您可以在文件中配置 JAVA-JVM 的相关系统配置项。
  • iotdb-engine.properties:IoTDB 引擎层系统配置项的默认配置文件。您可以在文件中配置 IoTDB 引擎运行时的相关参数。此外,用户可以在文件中配置 IoTDB 存储时 TsFile 文件的相关信息,如每次将内存中的数据写入到磁盘前的缓存大小 (group_size_in_byte),内存中每个列打一次包的大小 (page_size_in_byte) 等。
  • logback.xml: 日志配置文件,比如日志级别等。
  • iotdb-cluster.properties: IoTDB 集群所需要的一些配置。

iotdb-engine.propertiesiotdb-env.sh/iotdb-env.bat 两个配置文件详细说明请参考 附录/配置手册集群搭建 - 图3 (opens new window),与集群有关的配置项是在iotdb-cluster.properties文件中的,你可以直接查看 配置文件集群搭建 - 图4 (opens new window) 中的注释,也可以参考 Cluster Configuration

配置文件位于 {cluster_root_dir}/conf

你需要修改每个节点以下的配置项去启动你的IoTDB集群:

  • iotdb-engine.properties:

    • rpc_address

    • rpc_port

    • base_dir

    • data_dirs

    • wal_dir

  • iotdb-cluster.properties

    • internal_ip

    • internal_meta_port

    • internal_data_port

    • cluster_info_public_port

    • seed_nodes

    • default_replica_num

被覆盖的单机版选项

iotdb-engines.properties 配置文件中的部分内容会不再生效:

  • enable_auto_create_schema 不再生效,并被视为false. 应使用 iotdb-cluster.properties 中的 enable_auto_create_schema 来控制是否自动创建序列。
  • is_sync_enable 不再生效,并被视为 false.

启动服务

启动集群

您可以多节点部署或单机部署分布式集群,两者的主要区别是后者需要处理端口和文件目录的冲突,配置项含义请参考 配置项集群搭建 - 图5 (opens new window)。 启动其中一个节点的服务,需要执行如下命令:

  1. # Unix/OS X
  2. > nohup sbin/start-node.sh [printgc] [<conf_path>] >/dev/null 2>&1 &
  3. # Windows
  4. > sbin\start-node.bat [printgc] [<conf_path>]

printgc表示在启动的时候,会开启 GC 日志。 <conf_path>使用conf_path文件夹里面的配置文件覆盖默认配置文件。GC 日志默认是关闭的。为了性能调优,用户可能会需要收集 GC 信息。GC 日志会被存储在IOTDB_HOME/logs/下面。

如果你启动了所有seed节点,并且所有seed节点可以相互通信并没有ip地址/端口和文件目录的冲突,集群就成功启动了。

集群扩展

在集群运行过程中,用户可以向集群中加入新的节点或者删除集群中已有节点。目前仅支持逐节点集群扩展操作,多节点的集群扩展可以转化为一系列单节点集群扩展操作来实现。集群只有在上一次集群扩展操作完成后才会接收新的集群扩展操作。

在要加入集群的新节点上启动以下脚本进行增加节点操作:

  1. # Unix/OS X
  2. > nohup sbin/add-node.sh [printgc] [<conf_path>] >/dev/null 2>&1 &
  3. # Windows
  4. > sbin\add-node.bat [printgc] [<conf_path>]

printgc表示在启动的时候,会开启 GC 日志。 <conf_path>使用conf_path文件夹里面的配置文件覆盖默认配置文件。

在任一集群中的节点上启动以下脚本进行删除节点操作:

  1. # Unix/OS X
  2. > sbin/remove-node.sh <internal_ip> <internal_meta_port>
  3. # Windows
  4. > sbin\remove-node.bat <internal_ip> <internal_meta_port>

internal_ip表示待删除节点的 IP 地址 internal_meta_port表示待删除节点的 meta 服务端口

使用 Cli 工具

安装环境请参考 快速上手/安装环境章节集群搭建 - 图6 (opens new window)。你可以根据节点的rpc_address和rpc_port向任何节点发起连接。

停止集群

在任一机器上启动以下脚本进行停止所有运行在该机器上的节点服务操作:

  1. # Unix/OS X
  2. > sbin/stop-node.sh
  3. # Windows
  4. > sbin\stop-node.bat

附录

集群配置项

  • internal_ip
名字internal_ip
描述IOTDB 集群各个节点之间内部通信的 IP 地址,比如心跳、snapshot 快照、raft log 等。internal_ip是集群内部的私有ip
类型String
默认值127.0.0.1
改后生效方式重启服务生效,集群建立后不可再修改
  • internal_meta_port
名字internal_meta_port
描述IoTDB meta 服务端口,用于元数据组(又称集群管理组)通信,元数据组管理集群配置和存储组信息IoTDB 将为每个 meta 服务自动创建心跳端口。默认 meta 服务心跳端口为internal_meta_port+1,请确认这两个端口不是系统保留端口并且未被占用
类型Int32
默认值9003
改后生效方式重启服务生效,集群建立后不可再修改
  • internal_data_port
名字internal_data_port
描述IoTDB data 服务端口,用于数据组通信,数据组管理数据模式和数据的存储IoTDB 将为每个 data 服务自动创建心跳端口。默认的 data 服务心跳端口为internal_data_port+1。请确认这两个端口不是系统保留端口并且未被占用
类型Int32
默认值40010
改后生效方式重启服务生效,集群建立后不可再修改
  • cluster_info_public_port
名字cluster_info_public_port
描述用于查看集群信息(如数据分区)的 RPC 服务的接口
类型Int32
默认值6567
改后生效方式重启服务生效
  • open_server_rpc_port
名字open_server_rpc_port
描述是否打开单机模块的 rpc port,用于调试模式,如果设置为 true,则单机模块的 rpc port 设置为rpc_port (in iotdb-engines.properties) + 1
类型Boolean
默认值false
改后生效方式重启服务生效,集群建立后不可再修改
  • seed_nodes
名字seed_nodes
描述集群中节点的地址(私有ip),{IP/DOMAIN}:internal_meta_port格式,用逗号分割;对于伪分布式模式,可以都填写localhost,或是127.0.0.1 或是混合填写,但是不能够出现真实的 ip 地址;对于分布式模式,支持填写 real ip 或是 hostname,但是不能够出现localhost或是127.0.0.1。当使用start-node.sh(.bat)启动节点时,此配置意味着形成初始群集的节点,每个节点的seed_nodes应该一致,否则群集将初始化失败;当使用add-node.sh(.bat)添加节点到集群中时,此配置项可以是集群中已经存在的任何节点,不需要是用start-node.sh(bat)构建初始集群的节点。
类型String
默认值127.0.0.1:9003,127.0.0.1:9005,127.0.0.1:9007
改后生效方式重启服务生效
  • rpc_thrift_compression_enable
名字rpc_thrift_compression_enable
描述是否开启 thrift 压缩通信,注意这个参数要各个节点保持一致,也要与客户端保持一致,同时也要与iotdb-engine.propertiesrpc_thrift_compression_enable参数保持一致
类型Boolean
默认值false
改后生效方式重启服务生效,需要整个集群同时更改
  • default_replica_num
名字default_replica_num
描述集群副本数
类型Int32
默认值3
改后生效方式重启服务生效,集群建立后不可更改
  • multi_raft_factor
名字multi_raft_factor
描述每个数据组启动的 raft 组实例数量,默认每个数据组启动一个 raft 组
类型Int32
默认值1
改后生效方式重启服务生效,集群建立后不可更改
  • cluster_name
名字cluster_name
描述集群名称,集群名称用以标识不同的集群,一个集群中所有节点的 cluster_name 都应相同
类型String
默认值default
改后生效方式重启服务生效
  • connection_timeout_ms
名字connection_timeout_ms
描述raft 节点间的 thrift 连接超时和 socket 超时时间,单位毫秒. 对于发送心跳和投票请求的 thrift 连接的超时时间会被自动调整为 connection_timeout_ms 和 heartbeat_interval_ms 的最小值.
类型Int32
默认值20000
改后生效方式重启服务生效
  • heartbeat_interval_ms
名字heartbeat_interval_ms
描述领导者发送心跳广播的间隔时间,单位毫秒
类型Int64
默认值1000
改后生成方式重启服务生效
  • election_timeout_ms
名字election_timeout_ms
描述跟随者的选举超时时间, 以及选举者等待投票的超时时间, 单位毫秒
类型Int64
默认值20000
改后生成方式重启服务生效
  • read_operation_timeout_ms
名字read_operation_timeout_ms
描述读取操作超时时间,仅用于内部通信,不适用于整个操作,单位毫秒
类型Int32
默认值30000
改后生效方式重启服务生效
  • write_operation_timeout_ms
名字write_operation_timeout_ms
描述写入操作超时时间,仅用于内部通信,不适用于整个操作,单位毫秒
类型Int32
默认值30000
改后生效方式重启服务生效
  • min_num_of_logs_in_mem
名字min_num_of_logs_in_mem
描述删除日志操作执行后,内存中保留的最多的提交的日志的数量。增大这个值将减少在 CatchUp 使用快照的机会,但也会增加内存占用量
类型Int32
默认值100
改后生效方式重启服务生效
  • max_num_of_logs_in_mem
名字max_num_of_logs_in_mem
描述当内存中已提交的日志条数达到这个值之后,就会触发删除日志的操作,增大这个值将减少在 CatchUp 使用快照的机会,但也会增加内存占用量
类型Int32
默认值1000
改后生效方式重启服务生效
  • log_deletion_check_interval_second
名字log_deletion_check_interval_second
描述检查删除日志任务的时间间隔,每次删除日志任务将会把已提交日志超过 min_num_of_logs_in_mem 条的最老部分删除,单位秒
类型Int32
默认值60
改后生效方式重启服务生效
  • enable_auto_create_schema
名字enable_auto_create_schema
描述是否支持自动创建 schema,这个值会覆盖iotdb-engine.propertiesenable_auto_create_schema的配置
类型BOOLEAN
默认值true
改后生效方式重启服务生效
  • consistency_level
名字consistency_level
描述读一致性,目前支持 3 种一致性:strong、mid、weak。strong consistency 每次操作都会尝试与 Leader 同步以获取最新的数据,如果失败(超时),则直接向用户返回错误; mid consistency 每次操作将首先尝试与 Leader 进行同步,但是如果失败(超时),它将使用本地当前数据向用户提供服务; weak consistency 不会与 Leader 进行同步,而只是使用本地数据向用户提供服务
类型strong、mid、weak
默认值mid
改后生效方式重启服务生效
  • is_enable_raft_log_persistence
名字is_enable_raft_log_persistence
描述是否开启 raft log 持久化
类型BOOLEAN
默认值true
改后生效方式重启服务生效