导入数据

导入数据

准备好 CSV 文件，创建了 Schema 后，用户可以使用导入功能将所有点和边数据上传到 Studio，用于数据查询、图探索和数据分析。

前提条件

导入数据之前，需要确认以下信息：

Studio 已经连接到 Nebula Graph 数据库。
Nebula Graph 数据库里已经创建了 Schema。
CSV 文件符合 Schema 要求。
账号拥有 GOD、ADMIN、DBA 或者 USER 的权限，能往图空间中写入数据。

操作步骤

按以下步骤导入数据：

在工具栏里，点击导入页签。
在 选择Space 页面，选择一个图空间，再点击 下一步 按钮。
在 上传文件 页面，点击 上传文件 按钮，并选择需要的 CSV 文件。本示例中，选择 edge_serve.csv、edge_follow.csv、vertex_player.csv 和 vertex_team.csv 文件。

Note

一次可以选择多个 CSV 文件，本文使用的 CSV 文件可以在规划 Schema中下载。
在文件列表的操作列，点击预览或删除，保证文件信息正确，之后，再点击 下一步 按钮。
在 关联点 页面，点击 + 绑定数据源 按钮，在对话框中选择点数据文件，并点击确认按钮。如本示例中的 vertex_player.csv 或 vertex_team.csv 文件。
在 数据源 X 页签下，点击 + Tag 按钮。
在 vertexId 部分，完成以下操作：
1. 在 对应列标 列，点击选择。
2. 在弹出对话框中，选择数据列。在本示例中，vertex_player.csv 中仅有一列数据用于生成代表球员的 VID，vertex_player.csv 中选择表示 playerID 信息的 Column 0 用于生成代表球员的 VID。
  
  Note
  
  在同一个图空间中，VID 始终唯一，不可重复。关于 VID 的信息，参考 Nebula Graph 的点ID “点击进入 Nebula Graph 用户手册”。
在 TAG 1 部分，完成以下操作：
1. 在 TAG 下拉列表中，选择数据源对应的Tag名称。在本示例中，vertex_player.csv 文件对应选择 player；vertex_team.csv 文件对应选择 team。
2. 在显示的属性列表中，点击选择，为Tag属性绑定源数据。在本示例中，player 标签的 name 属性对应 vertex_player.csv 文件中的 Column 2 列，类型为 string，age 属性对应文件中的 Column 1 列，类型为 int；team 标签的 name 属性对应 vertex_team.csv 文件中的 Column 1 列，类型为 string。
（可选）如果有多个Tag数据文件，重复步骤 5 到步骤 8。
完成配置后，点击 下一步。
界面提示 配置验证成功，表示Tag数据源绑定成功。
在 关联边 页面，点击 + 绑定数据源 按钮，在对话框中选择边数据文件，并点击确认按钮。如本示例中的 edge_follow.csv 文件。
在 Edge X 页签的类型下拉列表中，选择Edge type名称。本示例中，选择 follow。
根据Edge type的属性，从 edge_follow.csv 文件中选择相应的数据列。其中，srcId 和 dstId 分别表示边的起点与终点，所选择的数据及处理方式必须与相应的 VID 保持一致。本示例中，srcId 对应的是表示起点球员的 VID，dstId 对应的是表示终点球员的 VID。rank 为选填项，可以忽略。
完成设置后，点击 下一步 按钮。
在导入页面，点击导入按钮开始导入数据。在 log 页面上可以看到数据导入进度。导入所需时间因数据量而异。导入过程中可以点击 终止导入 停止数据导入。当 log 页面显示如图所示信息时，表示数据导入完成。

后续操作

完成数据导入后，用户可以开始图探索。

最后更新: September 6, 2021