常见问题 FAQ

常见问题 FAQ

本文列出了使用Nebula Graph 2.5.1 时可能遇到的常见问题，用户可以使用文档中心或者浏览器的搜索功能查找相应问题。

如果按照文中的建议无法解决问题，请到Nebula Graph论坛提问或提交GitHub issue。

关于本手册

为什么手册示例和系统行为不一致？

Nebula Graph一直在持续开发，功能或操作的行为可能会有变化，如果发现不一致，请提交issue通知Nebula Graph团队。

Note

如果发现本文档中的错误:

用户可以点击页面顶部右上角的”铅笔”图标进入编辑页面。
使用 Markdown 修改文档。完成后点击页面底部的 “Commit changes”，这会触发一个 GitHub pull request。
完成CLA签署，并且至少2位reviewer审核通过即可合并。

关于历史兼容性

X版本兼容性

Nebula Graph 2.5.1 与历史版本 (包括 Nebula Graph 1.x 和 2.0-RC) 的数据格式、客户端通信协议均双向不兼容。数据格式升级参见升级 Nebula Graph 历史版本至 v2.0.0。客户端与工具均需要下载对应版本。

Y版本兼容性

Neubla Graph 2.5.1 与 Nebula Graph 2.0 的数据格式兼容，客户端不兼容。

关于执行

关于悬挂边

悬挂边 (Dangling edge) 是指一条边的起点或者终点在数据库中不存在。

Nebula Graph 2.5.1 的数据模型中，允许存在”悬挂边”；也没有 openCypher 中的 MERGE 语句。对于悬挂边的保证完全依赖应用层面。详见INSERT VERTEX, DELETE VERTEX, INSERT EDGE, DELETE EDGE。

如何处理错误信息 `[ERROR (-1005)]: Used memory hits the high watermark(0.800000) of total system memory.`

报错原因：Nebula Graph的system_memory_high_watermark_ratio参数指定了内存高水位报警机制的触发阈值，默认为0.8。系统内存占用率高于该值会触发报警机制，Nebula Graph会停止接受查询。

解决方案：

清理系统内存，使其降低到阈值以下。
修改Graph配置。在所有Graph服务器的配置文件中增加system_memory_high_watermark_ratio参数，为其设置一个大于0.8的值，例如0.9。

Note

仅Graph服务支持system_memory_high_watermark_ratio，Storage和Meta服务不支持该参数。

如何处理错误信息 `Storage Error E_RPC_FAILURE`

报错原因通常为Graph服务向Storage服务请求了过多的数据，导致Storage服务超时。请尝试以下解决方案：

修改配置文件: 在nebula-graphd.conf文件中修改--storage_client_timeout_ms参数的值，以增加Storage client的连接超时时间。该值的单位为毫秒（ms）。例如，设置--storage_client_timeout_ms=60000。如果nebula-graphd.conf文件中未配置该参数，请手动增加。提示：请在配置文件开头添加—local_config=true再重启服务。
优化查询语句：减少全库扫描型的查询，无论是否用LIMIT限制了返回结果的数量；用 GO 语句改写 MATCH 语句（前者有优化，后者无优化）。
检查Storaged是否发生过 OOM。(dmesg |grep nebula)。
为 Storage 服务器提供性能更好的SSD或者内存。
重试请求。

如何处理错误信息 `The leader has changed. Try again later`

已知问题，通常需要重试 1-N 次(N==partition数量)。原因为 meta client 更新leader缓存需要1-2个心跳或者通过错误触发强制更新。

返回消息中 `time spent` 的含义是什么？

将命令SHOW SPACES返回的消息作为示例：

nebula> SHOW SPACES;
+-------------------+
| Name              |
+-------------------+
| basketballplayer  |
+-------------------+
Got 1 rows (time spent 1235/1934 us)

第一个数字1235表示数据库本身执行该命令花费的时间，即查询引擎从客户端接收到一个查询，然后从存储服务器获取数据并执行一系列计算所花费的时间。
第二个数字1934表示从客户端角度看所花费的时间，即从客户端发送请求、接收结果，然后在屏幕上显示结果所花费的时间。

可以在`CREATE SPACE`时设置`replica_factor`为偶数（例如设置为2）吗？

不要这样设置。

Storage 服务使用 Raft 协议（多数表决），为保证可用性，要求出故障的副本数量不能达到一半。

当机器数量为1时，replica_factor只能设置为1。

当机器数量足够时，如果replica_factor=2，当其中一个副本故障时，就会导致系统无法正常工作；如果replica_factor=4，只能有一个副本可以出现故障，这和replica_factor=3是一样。以此类推，所以replica_factor设置为奇数即可。

建议在生产环境中设置replica_factor=3，测试环境中设置replica_factor=1，不要使用偶数。

是否支持停止或者中断慢查询

支持。

详情请参见终止查询。

使用`GO`和`MATCH`执行相同语义的查询，查询结果为什么不同？

悬挂边。

RETURN 命令未指定排序方式。

稠密点截断。

路径的类型不同，导致查询结果可能会不同。

GO语句采用的是walk类型，遍历时点和边可以重复。
MATCH语句兼容openCypher，采用的是trail类型，遍历时只有点可以重复，边不可以重复。

例如下图。

从点A开始查询距离5跳的点，都会查询到点C（A->B->C->D->E->C），查询6跳的点时，GO语句会查询到点D（A->B->C->D->E->C->D），因为边C->D可以重复查询，而MATCH语句查询为空，因为边不可以重复。

所以使用GO和MATCH执行相同语义的查询，可能会出现MATCH语句的查询结果比GO语句少。

关于路径的详细说明，请参见维基百科#Walk,_trail,_path)。

如何处理错误信息`[ERROR (-7)]: SyntaxError: syntax error near`？

大部分情况下，查询语句需要有YIELD或RETURN，请检查查询语句是否包含。

如何统计每种Tag有多少个点，每个Edge type有多少条边?

请参见show-stats。

如何获取每种Tag的所有点，或者每种Edge type的所有边?

建立并重建索引。

> CREATE TAG INDEX i_player ON player();
> REBUILD TAG INDEX i_player;

使用LOOKUP或MATCH语句。例如：

> LOOKUP ON player;
> MATCH (n:player) RETURN n;

更多详情请参见INDEX、LOOKUP和MATCH。

如何在不指定Tag/EdgeType的情况下，获取所有的点和边？

nGQL 没有该功能。

你必须先指定 Tag/EdgeType，才能获取对应类型的所有的点和边。

例如执行 MATCH (n) RETURN (n). 会返回错误 can’t solve the start vids from the sentence。

一个办法是使用Nebula Algorithm.

或者指定各Tag/Edge Type，然后再自己通过 Union 拼装。

如何处理错误信息`can’t solve the start vids from the sentence`

查询引擎需要知道从哪些VID开始图遍历。这些开始图遍历的VID，或者通过用户指定，例如：

> GO FROM ${vids} ...
> MATCH (src) WHERE id(src) == ${vids}
# 开始图遍历的VID通过如上办法指定

或者通过一个属性索引来得到，例如：

# CREATE TAG INDEX i_player ON player(name(20));
# REBUILD TAG INDEX i_player;
> LOOKUP ON player WHERE player.name == "abc" | ... YIELD ...
> MATCH (src) WHERE src.name == "abc" ...
# 通过点属性name的索引，来得到VID

否则，就会抛出这样一个异常 can’t solve the start vids from the sentence。

如何处理错误信息`Wrong vertex id type: 1001`

检查输入的VID类型是否是create space设置的INT64或FIXED_STRING(N)。详情请参见create space。

如何处理错误信息`The VID must be a 64-bit integer or a string fitting space vertex id length limit.`

检查输入的VID是否超过限制长度。详情请参见create space。

如何处理错误信息 `edge conflict` 或 `vertex conflict`

Storage服务在毫秒级时间内多次收到插入或者更新同一点或边的请求时，可能返回该错误。请稍后重试。

如何处理错误信息 `RPC failure in MetaClient: Connection refused`

报错原因通常为metad服务状态异常，或是metad和graphd服务所在机器网络不通。请尝试以下解决方案：

在metad所在服务器查看下 metad 服务状态，如果服务状态异常，可以重新启动metad服务。
在报错服务器下使用telnet meta-ip:port查看网络状态。
检查配置文件中的端口配置，如果端口号与连接时使用的不同，改用配置文件中的端口或者修改配置。

如何处理 `nebula-graph.INFO` 中错误日志 `StorageClientBase.inl:214] Request to "x.x.x.x":9779 failed: N6apache6thrift9transport19TTransportExceptionE: Timed Out`

报错原因可能是查询的数据量比较大，storaged 处理超时。请尝试以下解决方法：

导入数据时，手动compaction，加速读的速度。
增加Graph服务与Storage服务的RPC连接超时时间，在nebula-storaged.conf文件里面修改--storage_client_timeout_ms参数的值。该值的单位为毫秒（ms），默认值为60000毫秒。

如何处理 `nebula-storaged.INFO` 中错误日志 `MetaClient.cpp:65] Heartbeat failed, status:Wrong cluster!` 或者 `nebula-metad.INFO` 含有错误日志`HBProcessor.cpp:54] Reject wrong cluster host "x.x.x.x":9771!`

报错的原因可能是用户修改了 metad 的 ip 或者端口信息，或者 storage 之前加入过其他集群。请尝试以下解决方法：

用户到storage部署的机器所在的安装目录（默认安装目录为 /usr/local/nebula）下面将cluster.id文件删除，然后重启 storaged 服务。

能不能用中文字符做标识符，比如图空间、Tag、Edge type、属性、索引的名称？

不能。

图空间、Tag、Edge type、属性以及索引的名称都需由大小写英文字母、数字或下划线组成，暂不支持使用中文字符。

同时，上述标识符区分大小写，且不可使用关键字和保留字。

获取指定点的出度（或者入度）?

一个点的“出度”是指从该点出发的“边”的条数。入度，是指指向该点的边的条数。

nebula > MATCH (s)-[e]->() WHERE id(s) == "given" RETURN count(e); #出度
nebula > MATCH (s)<-[e]-() WHERE id(s) == "given" RETURN count(e); #入度

是否有办法快速获取“所有”点的出度和入度？

没有直接命令。

可以使用 Nebula Algorithm。

[ERROR (-1005)]: Schema not exist: xxx

查询时提示Schema not exist，请确认：

Schema中是否存在该Tag或Edge type。
Tag或Edge type的名称是否为关键字，如果是关键字，请使用反引号（`）将它们括起来。详情请参见关键字。

关于运维

日志文件过大时如何回收日志？

Nebula Graph 的日志默认在 /usr/local/nebula/logs/ 下, 正常INFO级别日志文件为 nebula-graphd.INFO, nebula-storaged.INFO, nebula-metad.INFO，报警和错误级别后缀为 .WARNING 和 .ERROR。

Nebula Graph使用 glog 打印日志。glog 没有日志回收的功能，用户可以使用 crontab 设置定期任务回收日志文件，详情请参见Glog should delete old log files automatically。

如何查看Nebula Graph版本

服务运行时: nebula-console 中执行命令 SHOW HOSTS META，详见SHOW HOSTS

服务未运行时: 在安装路径的bin目录内，执行./<binary_name> --version命令，可以查看到version和GitHub上的commit ID，例如：

$ ./nebula-graphd --version
nebula-graphd version 2.5.0, Git: c397299c, Build Time: Aug 19 2021 11:20:18

Docker Compose部署

查看Docker Compose部署的Nebula Graph版本，方式和编译安装类似，只是要先进入容器内部，示例命令如下：
```
docker exec -it nebula-docker-compose_graphd_1 bash
cd bin/
./nebula-graphd --version
```
RPM/DEB包安装

执行rpm -qa |grep nebula即可查看版本。

如何扩缩容

Nebula Graph 2.5.1 未提供运维命令以实现自动扩缩容，参考以下步骤：

metad 的扩容和缩容： metad 不支持扩缩容，也不支持迁移到新机器，也不要增加新的 metad 进程。
graphd 的缩容：将该graphd 的 ip 从 client 的代码中移除，关闭该 graphd 进程。
graphd 的扩容：在新机器上准备 graphd 二进制文件和配置文件，在配置文件中修改或增加已在运行的 metad 地址，启动 graphd 进程。
storaged 的缩容：（副本数都必须大于1），参考缩容命令。完成后关闭 storaged 进程。
storaged 的扩容：（副本数都必须大于1）在新机器上准备 storaged 二进制文件和配置文件，在配置文件中修改或增加已在运行的 metad 地址，启动 storaged 进程。

storaged扩缩容之后，还需要运行Balance Data 和 Balance Leader 命令。

修改Host名称后，旧的Host一直显示 `OFFLINE` 怎么办？

OFFLINE 状态的 Host 将在一天后自动删除。

关于连接

防火墙中需要开放哪些端口

如果没有修改过配置文件中预设的端口，请在防火墙中开放如下端口：

服务类型	端口
Meta	9559, 9560, 19559, 19560
Graph	9669, 19669, 19670
Storage	9777 ~ 9780, 19779, 19780

如果修改过配置文件中预设的端口，请找出实际使用的端口并在防火墙中开放它们。

周边工具各自使用不用的端口，请参考各工具文档。

如何测试端口是否已开放

用户可以使用如下telnet命令检查端口状态：

telnet <ip> <port>

Note

如果无法使用telnet命令，请先检查主机中是否安装并启动了telnet。

示例：

// 如果端口已开放：
$ telnet 192.168.1.10 9669
Trying 192.168.1.10...
Connected to 192.168.1.10.
Escape character is '^]'.
// 如果端口未开放：
$ telnet 192.168.1.10 9777
Trying 192.168.1.10...
telnet: connect to address 192.168.1.10: Connection refused

最后更新: November 3, 2021

常见问题 FAQ

常见问题 FAQ

关于本手册

为什么手册示例和系统行为不一致？

关于历史兼容性

关于执行

关于悬挂边

如何处理错误信息 [ERROR (-1005)]: Used memory hits the high watermark(0.800000) of total system memory.

如何处理错误信息 Storage Error E_RPC_FAILURE

如何处理错误信息 The leader has changed. Try again later

返回消息中 time spent 的含义是什么？

可以在CREATE SPACE时设置replica_factor为偶数（例如设置为2）吗？

是否支持停止或者中断慢查询

使用GO和MATCH执行相同语义的查询，查询结果为什么不同？

如何处理错误信息[ERROR (-7)]: SyntaxError: syntax error near？

如何统计每种Tag有多少个点，每个Edge type有多少条边?

如何获取每种Tag的所有点，或者每种Edge type的所有边?

如何在不指定Tag/EdgeType的情况下，获取所有的点和边？

如何处理错误信息can’t solve the start vids from the sentence

如何处理错误信息Wrong vertex id type: 1001

如何处理错误信息The VID must be a 64-bit integer or a string fitting space vertex id length limit.

如何处理错误信息 edge conflict 或 vertex conflict

如何处理错误信息 RPC failure in MetaClient: Connection refused

如何处理 nebula-graph.INFO 中错误日志 StorageClientBase.inl:214] Request to "x.x.x.x":9779 failed: N6apache6thrift9transport19TTransportExceptionE: Timed Out

如何处理 nebula-storaged.INFO 中错误日志 MetaClient.cpp:65] Heartbeat failed, status:Wrong cluster! 或者 nebula-metad.INFO 含有错误日志HBProcessor.cpp:54] Reject wrong cluster host "x.x.x.x":9771!

能不能用中文字符做标识符，比如图空间、Tag、Edge type、属性、索引的名称？

获取指定点的出度（或者入度）?

是否有办法快速获取“所有”点的出度和入度？

[ERROR (-1005)]: Schema not exist: xxx

关于运维

日志文件过大时如何回收日志？

如何查看Nebula Graph版本

如何扩缩容

修改Host名称后，旧的Host一直显示 OFFLINE 怎么办？

关于连接

防火墙中需要开放哪些端口

如何测试端口是否已开放

如何处理错误信息 `[ERROR (-1005)]: Used memory hits the high watermark(0.800000) of total system memory.`

如何处理错误信息 `Storage Error E_RPC_FAILURE`

如何处理错误信息 `The leader has changed. Try again later`

返回消息中 `time spent` 的含义是什么？

可以在`CREATE SPACE`时设置`replica_factor`为偶数（例如设置为2）吗？

使用`GO`和`MATCH`执行相同语义的查询，查询结果为什么不同？

如何处理错误信息`[ERROR (-7)]: SyntaxError: syntax error near`？

如何处理错误信息`can’t solve the start vids from the sentence`

如何处理错误信息`Wrong vertex id type: 1001`

如何处理错误信息`The VID must be a 64-bit integer or a string fitting space vertex id length limit.`

如何处理错误信息 `edge conflict` 或 `vertex conflict`

如何处理错误信息 `RPC failure in MetaClient: Connection refused`

如何处理 `nebula-graph.INFO` 中错误日志 `StorageClientBase.inl:214] Request to "x.x.x.x":9779 failed: N6apache6thrift9transport19TTransportExceptionE: Timed Out`

如何处理 `nebula-storaged.INFO` 中错误日志 `MetaClient.cpp:65] Heartbeat failed, status:Wrong cluster!` 或者 `nebula-metad.INFO` 含有错误日志`HBProcessor.cpp:54] Reject wrong cluster host "x.x.x.x":9771!`

修改Host名称后，旧的Host一直显示 `OFFLINE` 怎么办？