动态目录

本节介绍openLooKeng的动态目录特性。通常openLooKeng管理员通过将目录概要文件(例如hive.properties)放置在连接节点目录(etc/catalog)下来将数据源添加到引擎。每当需要添加、更新或删除目录时,都需要重启所有协调节点和工作节点。

为了动态修改目录,openLooKeng引入了动态目录的特性。开启此特性需要在etc/config.properties中配置:

  1. catalog.dynamic-enabled=true

然后在hdfs-config-catalog.propertieslocal-config-catalog.properties中配置用于存储动态目录信息的文件系统。查看文件系统文档以获取更多信息。

使用

目录操作是通过openLooKeng协调节点上的RESTful API来完成的。HTTP请求具有如下形态(以hive连接节点为例):

  1. request: POST/DELETE/PUT
  2. header: ``X-Presto-User: admin``
  3. form: 'catalogInformation={
  4. "catalogName" : "hive",
  5. "connectorName" : "hive-hadoop2",
  6. "properties" : {
  7. "hive.hdfs.impersonation.enabled" : "false",
  8. "hive.hdfs.authentication.type" : "KERBEROS",
  9. "hive.collect-column-statistics-on-write" : "true",
  10. "hive.metastore.service.principal" : "hive/hadoop.hadoop.com@HADOOP.COM",
  11. "hive.metastore.authentication.type" : "KERBEROS",
  12. "hive.metastore.uri" : "thrift://xx.xx.xx.xx:21088",
  13. "hive.allow-drop-table" : "true",
  14. "hive.config.resources" : "core-site.xml,hdfs-site.xml",
  15. "hive.hdfs.presto.keytab" : "user.keytab",
  16. "hive.metastore.krb5.conf.path" : "krb5.conf",
  17. "hive.metastore.client.keytab" : "user.keytab",
  18. "hive.metastore.client.principal" : "test@HADOOP.COM",
  19. "hive.hdfs.wire-encryption.enabled" : "true",
  20. "hive.hdfs.presto.principal" : "test@HADOOP.COM"
  21. }
  22. }',
  23. 'catalogConfigurationFiles=path/to/core-site.xml',
  24. 'catalogConfigurationFiles=path/to/hdfs-site.xml',
  25. 'catalogConfigurationFiles=path/to/user.keytab',
  26. 'globalConfigurationFiles=path/to/krb5.conf'

添加目录

当添加新目录时,会向协调节点发送一个POST请求。协调节点首先重写文件路径属性,将文件保存到本地磁盘,并通过加载新添加的目录来验证操作。如果目录加载成功,协调节点将文件保存到共享文件系统(例如HDFS)。

其他协调节点和工作节点定期检查共享文件系统中的目录属性文件。当发现新的目录时,他们把相关的配置文件拉到本地磁盘,然后将目录加载到内存中。

删除目录

与添加操作类似,当需要删除目录时,向协调节点发送DELETE请求。接收请求的协调节点从本地磁盘中删除相关目录概要文件,从服务器卸载目录,并从共享文件系统中删除目录。

其他协调节点和工作节点定期检查共享文件系统中的目录属性文件。当删除目录时,协调节点和工作节点也会删除本地磁盘上的相关配置文件,然后从内存中卸载目录。

更新目录

更新操作是删除和添加操作的组合。首先管理员向协调节点发送PUT请求。协调节点收到请求后在本地删除并添加目录以验证更改。如果操作成功,协调节点从共享文件系统中删除目录,并等待所有其他节点从本地文件系统中删除目录。将新的配置文件保存到共享文件系统中。

其他协调节点和工作节点定期检查共享文件系统中的目录属性文件,并在本地文件系统上执行相应的更改。

目录属性,包括 connector-nameproperties等,支持修改。但是目录名称不能更改。

API信息

HTTP请求

添加:POST host/v1/catalog

更新:PUT host/v1/catalog

删除:DELETE host/v1/catalog/{catalogName}

HTTP返回码

HTTP返回码POSTPUTDELETE
401 UNAUTHORIZED没有权限添加目录没有权限修改目录同PUT
302 FOUND目录已存在--
404 NOT_FOUND动态目录已停用目录不存在或动态目录已停用同PUT
400 BAD_REQUEST请求不正确同POST同PUT
409 CONFLICT另一个会话正在操作目录同POST同POST
500 INTERNAL_SERVER_ERROR协调节点内部发生错误同POST同POST
201 CREATED成功成功-
204 NO_CONTENT--成功

配置属性

etc/config.properties中:

属性名称是否必选描述默认值
catalog.dynamic-enabled是否启用动态目录false
catalog.scanner-interval扫描共享文件系统中目录的时间间隔。5s
catalog.max-file-size目录文件最大大小128 KB

etc/node.properties中:

属性名称是否必选描述默认值
catalog.config-dir本地磁盘存放配置文件的根目录。
catalog.share.config-dir共享文件系统中存放配置文件的根目录。

对查询的影响

  • 添加目录后,在扫描期间查询可能会失败。
  • 删除目录后,正在执行的查询可能会失败。查询可能能够在扫描期间完成。
  • 更新目录时,正在进行的查询可能会失败。更新目录后,在扫描期间查询可能会失败。