介绍

Apache Superset 是一个开源的数据挖掘平台,支持丰富的数据源连接,多种可视化方式,并能够对用户实现细粒度的权限控制。该工具主要特点是可自助分析、自定义仪表盘、分析结果可视化(导出)、用户/角色权限控制,还集成了一个 SQL 编辑器,可以进行 SQL 编辑查询等。

在 Apache Superset 3.1 版本中正式支持了 Apache Doris 的内部数据和外部数据进行查询和可视化处理。

前置条件

确保您已完成如下工具安装:

  1. 在 Apache Superset 服务器上安装 Apache Doris 的 Python 客户端。

    1. pip install pydoris
  2. 安装 Apache Superset 3.1 及其以上的版本。具体参见 安装 Superset 从 PyPI 库 或者 通过 Docker 容器的方式安装

添加数据源

  1. 通过对应的启动端口对 Apache Superset 进行访问。

    login page

  2. 登陆后选择添加数据库连接。

    add databases

  3. 在连接的弹窗页面中选择 Apache Doris。

    select databases

  4. 在连接信息中填写 SQLAlchemy URI,并进行相关的连接验证。

    test connection

当你在 Apache Superset 中创建数据源时,需要注意以下两点:

  • 在 SUPPORTED DATABASES 里选择 Apache Doris 作为数据源。

  • 在 SQLAlchemy URI 里,按如下 Apache Doris SQLAlchemy URI 格式填写 URI:

    doris://<User>:<Password>@<Host>:<Port>/<Catalog>.<Database>

  • URI 参数说明如下:

    • User:用于登录 Apache Doris 集群的用户名,如 Admin。

    • Password:用于登录 Apache Doris 集群的用户密码。

    • Host:Apache Doris 集群的 FE 主机 IP 地址。

    • Port:Apache Doris 集群的 FE 查询端口,如 9030。

    • Catalog:Apache Doris 集群中的目标 Catalog。Internal Catalog 和 External Catalog 均支持。

    • Database:Apache Doris 集群中的目标数据库。内部数据库和外部数据库均支持。

Apache Superset - 图5提示

  1. 当你使用最新的 Docker 镜像部署 Superset 时,如果发现找不到 Apache Doris 数据源,这个可能是因为 Apache Superset Docker Image 默认只包含基本的数据源构建,需要手动将 pydoris 包安装进来,您可以参考 Superset Docker 教程 中的 How to extend this image 步骤进行 Apache Superset 的部署。

  2. 推荐使用 Apache Doris 2.0.4 及以上版本。