Pulsar SQL Overview

Apache Pulsar 用于存储事件数据流,而事件数据是以预定义的字段结构化的。 使用 Schema 注册表, 你可以在 Pulsar 中存储结构化数据,并通过使用 Presto 查询数据。

作为 Pulsar SQL 的核心,Presto Pulsar 连接器允许 Presto 群组中的 workers 用来从 Pulsar 中查询数据。

Pulsar的消费者和读取器接口

它具有查询性能高、有效率且可高度扩展,因为 Pulsar 通过 两个级别的构造

Pulsar 中的主题被存储在 Apache BookKeeper 中。 每个主题部分都复制到一些 BookKeeper 节点,这使得可以同时阅读和读取高通量。 你可以配置 BookKeeper 节点的数量,默认数字是 3。 在 Presto Pulsar 连接器中,数据直接从 BookKeeper 读取,所以 Presto workers 可以同时从水平可缩放的 BookKeeper 节点读取。

Pulsar的消费者和读取器接口