书栈网 · BookStack 本次搜索耗时 0.040 秒,为您找到 621 个相关结果.
  • Design & Concepts

    Design & Concepts FAQ How does Hudi ensure atomicity? Does Hudi extend the Hive table layout? What concurrency control approaches does Hudi adopt? Hudi’s commits are based on tr...
  • S3 Filesystem

    AWS configs AWS Credentials AWS Libs In this page, we explain how to get your Hudi spark job to store into AWS S3. AWS configs There are two configurations required for Hudi...
  • 快速开始

    Quick-Start Guide 设置spark-shell 插入数据 查询数据 更新数据 增量查询 特定时间点查询 从这开始下一步? Quick-Start Guide 本指南通过使用spark-shell简要介绍了Hudi功能。使用Spark数据源,我们将通过代码段展示如何插入和更新的Hudi默认存储类型数据集: 写时复制 。每次...
  • 写入数据

    写入 Hudi 数据集 写操作 DeltaStreamer Datasource Writer 与Hive同步 删除数据 存储管理 写入 Hudi 数据集 这一节我们将介绍使用DeltaStreamer 工具从外部源甚至其他Hudi数据集摄取新更改的方法, 以及通过使用Hudi数据源 的upserts加快大型Spark作业的方法。 对于此...
  • 写入数据

    写入 Hudi 数据集 写操作 DeltaStreamer Datasource Writer 与Hive同步 删除数据 存储管理 写入 Hudi 数据集 这一节我们将介绍使用DeltaStreamer 工具从外部源甚至其他Hudi数据集摄取新更改的方法, 以及通过使用Hudi数据源 的upserts加快大型Spark作业的方法。 对于此...
  • 写入数据

    写入 Hudi 数据集 写操作 DeltaStreamer Datasource Writer 与Hive同步 删除数据 存储管理 写入 Hudi 数据集 这一节我们将介绍使用DeltaStreamer 工具从外部源甚至其他Hudi数据集摄取新更改的方法, 以及通过使用Hudi数据源 的upserts加快大型Spark作业的方法。 对于此...
  • Bootstrapping

    Bootstrapping Approaches Use Hudi for new partitions alone Convert existing table to Hudi Using Hudi Streamer Using Spark Datasource Writer Using Spark SQL CALL Procedure Using...
  • Batch Writes

    Batch Writes Spark DataSource API Insert Overwrite Table Insert Overwrite Deletes Concurrency Control Java Client Batch Writes Spark DataSource API The hudi-spark module...
  • Clustering

    Clustering Background How is compaction different from clustering? Clustering Architecture Overall, there are 2 steps to clustering Schedule clustering Execute clustering Clu...
  • Compaction

    Compaction Background Why MOR tables need compaction? Compaction Architecture Strategies in Compaction Scheduling Trigger Strategies Compaction Strategies Ways to trigger Com...