书栈网 · BookStack 本次搜索耗时 0.057 秒,为您找到 621 个相关结果.
  • 云储存

    云储存 与云存储连接 云储存 与云存储连接 无论使用RDD/WriteClient API还是数据源,以下信息都有助于配置对云存储的访问。 AWS S3 S3和Hudi协同工作所需的配置。 Google Cloud Storage GCS和Hudi协同工作所需的配置。 Alibaba Cloud OSS 阿里云和Hudi协同工作所需的配置。...
  • 管理

    管理 Hudi Pipelines Admin CLI 检查提交 深入到特定的提交 文件系统视图 统计信息 归档的提交 压缩 验证压缩 注意 取消调度压缩 修复压缩 指标 故障排除 缺失记录 重复 Spark故障 管理 Hudi Pipelines 管理员/运维人员可以通过以下方式了解Hudi数据集/管道 通过Ad...
  • 管理

    管理 Hudi Pipelines Admin CLI 检查提交 深入到特定的提交 文件系统视图 统计信息 归档的提交 压缩 验证压缩 注意 取消调度压缩 修复压缩 指标 故障排除 缺失记录 重复 Spark故障 管理 Hudi Pipelines 管理员/运维人员可以通过以下方式了解Hudi数据集/管道 通过Ad...
  • SQL DML

    SQL DML Spark SQL Insert Into Insert Overwrite Update Merge Into Delete From Data Skipping and Indexing Flink SQL Insert Into Update Delete From Setting Writer/Reader Con...
  • Performance

    Performance Optimized DFS Access Performance Optimizations Write Path Bulk Insert Upserts Indexing Read Path Data Skipping Performance Optimized DFS Access Hudi also pe...
  • 查询数据

    查询 Hudi 数据集 查询引擎支持列表 读优化表 实时表 Hive 读优化表 实时表 增量拉取 Spark 读优化表 实时表 增量拉取 PrestoDB Impala (3.4 or later) 读优化表 查询 Hudi 数据集 从概念上讲,Hudi物理存储一次数据到DFS上,同时在其上提供三个逻辑视图,如之前 所述。...
  • All Configurations

    All Configurations Externalized Config File Hudi Table Config Hudi Table Basic Configs Spark Datasource Configs Read Options Write Options PreCommit Validator Configurations ...
  • JuiceFS

    JuiceFS JuiceFS configs Creating JuiceFS file system Download JuiceFS client Install JuiceFS client Format a JuiceFS file system Adding JuiceFS configuration for Hudi Adding J...
  • 使用案例

    使用案例 近实时摄取 近实时分析 增量处理管道 DFS的数据分发 使用案例 以下是一些使用Hudi的示例,说明了加快处理速度和提高效率的好处 近实时摄取 将外部源(如事件日志、数据库、外部源)的数据摄取到Hadoop数据湖 是一个众所周知的问题。 尽管这些数据对整个组织来说是最有价值的,但不幸的是,在大多数(如果不是全部)Hadoop部...
  • Post-commit Callback

    Post-commit Callback HTTP Endpoints Kafka Endpoints Pulsar Endpoints Bring your own implementation Post-commit Callback Apache Hudi provides the ability to post a callback n...