书栈网 · BookStack 本次搜索耗时 0.038 秒,为您找到 471 个相关结果.
  • 快速开始

    Quick-Start Guide 设置spark-shell 插入数据 查询数据 更新数据 增量查询 特定时间点查询 删除数据 Pyspark 示例 设置spark-shell 请注意以下事项: 插入数据 查询数据 更新数据 增量查询 特定时间点查询 删除数据 从这开始下一步? Quick-Start Guide ...
  • 对比

    对比 Kudu Hive事务 HBase 流式处理 对比 Apache Hudi填补了在DFS上处理数据的巨大空白,并可以和这些技术很好地共存。然而, 通过将Hudi与一些相关系统进行对比,来了解Hudi如何适应当前的大数据生态系统,并知晓这些系统在设计中做的不同权衡仍将非常有用。 Kudu Apache Kudu 是一个与Hudi具有...
  • 快速开始

    Quick-Start Guide 设置spark-shell 插入数据 查询数据 更新数据 增量查询 特定时间点查询 删除数据 Pyspark 示例 设置spark-shell 请注意以下事项: 插入数据 查询数据 更新数据 增量查询 特定时间点查询 删除数据 从这开始下一步? Quick-Start Guide ...
  • 快速开始

    Quick-Start Guide Scala 示例 设置spark-shell 插入数据 查询数据 更新数据 增量查询 特定时间点查询 删除数据 Pyspark 示例 设置spark-shell 请注意以下事项: 插入数据 查询数据 更新数据 增量查询 特定时间点查询 删除数据 从这开始下一步? Quick-St...
  • 写入数据

    写入 Hudi 数据集 写操作 DeltaStreamer Datasource Writer 与Hive同步 删除数据 存储管理 写入 Hudi 数据集 这一节我们将介绍使用DeltaStreamer 工具从外部源甚至其他Hudi数据集摄取新更改的方法, 以及通过使用Hudi数据源 的upserts加快大型Spark作业的方法。 对于此...
  • 写入数据

    写入 Hudi 数据集 写操作 DeltaStreamer Datasource Writer 与Hive同步 删除数据 存储管理 写入 Hudi 数据集 这一节我们将介绍使用DeltaStreamer 工具从外部源甚至其他Hudi数据集摄取新更改的方法, 以及通过使用Hudi数据源 的upserts加快大型Spark作业的方法。 对于此...
  • 写入数据

    写入 Hudi 数据集 写操作 DeltaStreamer Datasource Writer 与Hive同步 删除数据 存储管理 写入 Hudi 数据集 这一节我们将介绍使用DeltaStreamer 工具从外部源甚至其他Hudi数据集摄取新更改的方法, 以及通过使用Hudi数据源 的upserts加快大型Spark作业的方法。 对于此...
  • 查询数据

    查询 Hudi 数据集 查询引擎支持列表 读优化表 实时表 Hive 读优化表 实时表 增量拉取 Spark 读优化表 实时表 增量拉取 PrestoDB Impala (3.4 or later) 读优化表 查询 Hudi 数据集 从概念上讲,Hudi物理存储一次数据到DFS上,同时在其上提供三个逻辑视图,如之前 所述。...
  • 对比

    对比 Kudu Hive事务 HBase 流式处理 对比 Apache Hudi填补了在DFS上处理数据的巨大空白,并可以和这些技术很好地共存。然而, 通过将Hudi与一些相关系统进行对比,来了解Hudi如何适应当前的大数据生态系统,并知晓这些系统在设计中做的不同权衡仍将非常有用。 Kudu Apache Kudu 是一个与Hudi具有...
  • AWS S3

    S3 Filesystem AWS configs AWS Credentials AWS Libs S3 Filesystem In this page, we explain how to get your Hudi spark job to store into AWS S3. AWS configs There are two c...