书栈网 · BookStack 本次搜索耗时 0.065 秒,为您找到 471 个相关结果.
  • 云储存

    云储存 与云存储连接 云储存 与云存储连接 无论使用RDD/WriteClient API还是数据源,以下信息都有助于配置对云存储的访问。 AWS S3 S3和Hudi协同工作所需的配置。 Google Cloud Storage GCS和Hudi协同工作所需的配置。 Alibaba Cloud OSS 阿里云和Hudi协同工作所需的配置。...
  • GCS Filesystem

    GCS Configs GCS Credentials GCS Libs GCS Configs There are two configurations required for Hudi GCS compatibility: Adding GCS Credentials for Hudi Adding required jars to c...
  • 性能

    性能 插入更新 索引 读优化查询 性能 在本节中,我们将介绍一些有关Hudi插入更新、增量提取的实际性能数据,并将其与实现这些任务的其它传统工具进行比较。 插入更新 下面显示了从NoSQL数据库摄取获得的速度提升,这些速度提升数据是通过在写入时复制存储上的Hudi数据集上插入更新而获得的, 数据集包括5个从小到大的表(相对于批量加载表)。...
  • 性能

    性能 插入更新 索引 读优化查询 性能 在本节中,我们将介绍一些有关Hudi插入更新、增量提取的实际性能数据,并将其与实现这些任务的其它传统工具进行比较。 插入更新 下面显示了从NoSQL数据库摄取获得的速度提升,这些速度提升数据是通过在写入时复制存储上的Hudi数据集上插入更新而获得的, 数据集包括5个从小到大的表(相对于批量加载表)。...
  • Docker 示例

    Docker Demo A Demo using docker containers Prerequisites Setting up Docker Cluster Build Hudi Bringing up Demo Cluster Demo Step 1 : Publish the first batch to Kafka Step 2: ...
  • Docker 示例

    Docker Demo A Demo using docker containers Prerequisites Setting up Docker Cluster Build Hudi Bringing up Demo Cluster Demo Step 1 : Publish the first batch to Kafka Step 2: ...
  • IBM Cloud Object Storage

    IBM Cloud Object Storage Filesystem IBM COS configs IBM Cloud Object Storage Credentials IBM Cloud Object Storage Libs IBM Cloud Object Storage Filesystem In this page, we e...
  • 快速开始

    Quick-Start Guide 设置spark-shell 插入数据 查询数据 更新数据 增量查询 特定时间点查询 从这开始下一步? Quick-Start Guide 本指南通过使用spark-shell简要介绍了Hudi功能。使用Spark数据源,我们将通过代码段展示如何插入和更新Hudi的默认存储类型数据集: 写时复制 。每次...
  • 查询数据

    查询 Hudi 数据集 Hive 读优化表 实时表 增量拉取 Spark 读优化表 实时表 增量拉取 Presto Impala(此功能还未正式发布) 读优化表 查询 Hudi 数据集 从概念上讲,Hudi物理存储一次数据到DFS上,同时在其上提供三个逻辑视图,如之前 所述。 数据集同步到Hive Metastore后,它将提供...
  • AWS S3

    S3 Filesystem AWS configs AWS Credentials AWS Libs S3 Filesystem In this page, we explain how to get your Hudi spark job to store into AWS S3. AWS configs There are two c...