书栈网 · BookStack 本次搜索耗时 0.046 秒,为您找到 621 个相关结果.
  • CLI

    CLI Local set up Hudi CLI Bundle setup Base path Using Hudi-cli in S3 Note: These AWS jar versions below are specific to Spark 3.2.0 Using hudi-cli on Google Dataproc Connec...
  • 写入数据

    写入 Hudi 数据集 写操作 DeltaStreamer Datasource Writer 与Hive同步 删除数据 存储管理 写入 Hudi 数据集 这一节我们将介绍使用DeltaStreamer 工具从外部源甚至其他Hudi数据集摄取新更改的方法, 以及通过使用Hudi数据源 的upserts加快大型Spark作业的方法。 对于此...
  • 写入数据

    写入 Hudi 数据集 写操作 DeltaStreamer Datasource Writer 与Hive同步 删除数据 存储管理 写入 Hudi 数据集 这一节我们将介绍使用DeltaStreamer 工具从外部源甚至其他Hudi数据集摄取新更改的方法, 以及通过使用Hudi数据源 的upserts加快大型Spark作业的方法。 对于此...
  • 对比

    对比 Kudu Hive事务 HBase 流式处理 对比 Apache Hudi填补了在DFS上处理数据的巨大空白,并可以和这些技术很好地共存。然而, 通过将Hudi与一些相关系统进行对比,来了解Hudi如何适应当前的大数据生态系统,并知晓这些系统在设计中做的不同权衡仍将非常有用。 Kudu Apache Kudu 是一个与Hudi具有...
  • Using Spark

    Using Spark Hudi Streamer Options Using hudi-utilities-slim-bundle bundle jar Concurrency Control Checkpointing Transformers SQL Query Transformer SQL File Transformer Flatt...
  • Writing Tables

    Writing Tables FAQ What are some ways to write a Hudi table? How is a Hudi writer job deployed? Can I implement my own logic for how input records are merged with record on stora...
  • Writing Tables

    Writing Tables FAQ What are some ways to write a Hudi table? How is a Hudi writer job deployed? Can I implement my own logic for how input records are merged with record on stora...
  • Basic Configurations

    Basic Configurations Hudi Table Config Hudi Table Basic Configs Spark Datasource Configs Read Options Write Options Flink Sql Configs Flink Options Write Client Configs Comm...
  • Streaming Writes

    Streaming Writes Spark Streaming Streaming Writes Spark Streaming You can write Hudi tables using spark’s structured streaming. Scala Python // spark-shell // prepare to ...
  • AWS S3

    AWS S3 AWS configs AWS Credentials AWS Libs AWS S3 Versioned Bucket AWS S3 In this page, we explain how to get your Hudi spark job to store into AWS S3. AWS configs There ...