Kylin将它全部的元数据(包括cube描述和实例、项目、倒排索引描述和实例、任务、表和字典)组织成层级文件系统的形式。然而,Kylin 使用 Mysql 来存储元数据,而不是一个普通的文件系统。如果你查看过Kylin的配置文件(kylin.properties),你会发现这样一行:

  1. ## The metadata store in mysql
  2. kylin.metadata.url=kylin_metadata@jdbc,driverClassName=com.mysql.jdbc.Driver,url=jdbc:mysql://localhost:3306/kylin_database,username=,password=

这表明元数据会被保存在一个叫作 “kylin_metadata” 的 table 里, 并且该元数据 table 位于名为 kylin_database 的 database。

元数据路径

Kylin使用resource root path + resource name + resource suffix作为key值来存储元数据。你可以参考如下表格使用./bin/metastore.sh命令。

Resource root pathresource nameresource suffix
/cube/cube name.json
/cube_desc/cube name.json
/cube_statistics/cube name/uuid.seq
/model_desc/model name.json
/project/project name.json
/table/DATABASE.TABLE–project name.json
/table_exd/DATABASE.TABLE–project name.json
/execute/job id 
/execute_output/job id-step index 
/user/user name 

查看元数据

Kylin 以二进制字节的格式将元数据存储在 Mysql 中,如果你想要查看一些元数据,可以运行:

  1. ./bin/metastore.sh list /path/to/store/metadata

列出存储在指定路径下的所有实体元数据。然后运行:

  1. ./bin/metastore.sh cat /path/to/store/entity/metadata.

查看某个实体的元数据。

使用二进制包来备份 metadata

有时你需要将 Kylin 的 metadata store 从 Mysql 备份到磁盘文件系统。在这种情况下,假设你在部署 Kylin 的 hadoop 命令行(或沙盒)里,你可以到KYLIN_HOME并运行:

  1. ./bin/metastore.sh backup

来将你的元数据导出到本地目录,这个目录在KYLIN_HOME/metadata_backps下,它的命名规则使用了当前时间作为参数:KYLIN_HOME/meta_backups/meta_year_month_day_hour_minute_second 。

此外, 你可以运行:

  1. ./bin/metastore.sh fetch /path/to/store/metadata

有选择地导出元数据. 举个栗子, 运行 ./bin/metastore.sh fetch /cube_desc/ 获取所有的cube desc元数据, 或者运行 ./bin/metastore.sh fetch /cube_desc/kylin_sales_cube.json 导出单个cube desc的元数据。

使用二进制包来恢复 metadata

万一你发现你的元数据被搞得一团糟,想要恢复先前的备份:

首先,重置 metatdara store(这个会清理 Kylin 在 Mysql 的 metadata store的所有信息,请确保先备份):

  1. ./bin/metastore.sh reset

然后上传备份的元数据到 Kylin 的 metadata store:

  1. ./bin/metastore.sh restore $KYLIN_HOME/meta_backups/meta_xxxx_xx_xx_xx_xx_xx

有选择地恢复 metadata (推荐)

如果只更改了几个元数据文件,管理员只需选择要还原的这些文件,而不必覆盖所有元数据。 与完全恢复相比,这种方法更有效,更安全,因此建议使用。

创建一个新的空目录,然后根据要还原的元数据文件的位置在其中创建子目录; 例如,要恢复多维数据集实例,您应该创建一个“cube”子目录:

  1. mkdir /path/to/restore_new
  2. mkdir /path/to/restore_new/cube

将要还原的元数据文件复制到此新目录:

  1. cp meta_backups/meta_2016_06_10_20_24_50/cube/kylin_sales_cube.json /path/to/restore_new/cube/

此时,您可以手动修改/修复元数据。

从此目录还原:

  1. cd $KYLIN_HOME
  2. ./bin/metastore.sh restore /path/to/restore_new

只有在此文件夹中的文件才会上传到 Kylin Metastore。 同样,在恢复完成后,单击 Web UI 上的“Reload Metadata”按钮以刷新缓存。

在开发环境备份/恢复元数据

在开发调试 Kylin 时,典型的环境是一台装有 IDE 的开发机上和一个后台的沙盒,通常你会写代码并在开发机上运行测试案例,但每次都需要将二进制包放到沙盒里以检查元数据是很麻烦的。这时有一个名为 SandboxMetastoreCLI 工具类可以帮助你在开发机本地下载/上传元数据。