书栈网 · BookStack 本次搜索耗时 0.076 秒,为您找到 471 个相关结果.
  • 云储存

    云储存 与云存储连接 云储存 与云存储连接 无论使用RDD/WriteClient API还是数据源,以下信息都有助于配置对云存储的访问。 AWS S3 S3和Hudi协同工作所需的配置。 Google Cloud Storage GCS和Hudi协同工作所需的配置。 Alibaba Cloud OSS 阿里云和Hudi协同工作所需的配置。...
  • 管理

    管理 Hudi Pipelines Admin CLI 检查提交 深入到特定的提交 文件系统视图 统计信息 归档的提交 压缩 验证压缩 注意 取消调度压缩 修复压缩 指标 故障排除 缺失记录 重复 Spark故障 管理 Hudi Pipelines 管理员/运维人员可以通过以下方式了解Hudi数据集/管道 通过Ad...
  • 管理

    管理 Hudi Pipelines Admin CLI 检查提交 深入到特定的提交 文件系统视图 统计信息 归档的提交 压缩 验证压缩 注意 取消调度压缩 修复压缩 指标 故障排除 缺失记录 重复 Spark故障 管理 Hudi Pipelines 管理员/运维人员可以通过以下方式了解Hudi数据集/管道 通过Ad...
  • 管理

    管理 Hudi Pipelines Admin CLI 检查提交 深入到特定的提交 文件系统视图 统计信息 归档的提交 压缩 验证压缩 注意 取消调度压缩 修复压缩 指标 故障排除 缺失记录 重复 Spark故障 管理 Hudi Pipelines 管理员/运维人员可以通过以下方式了解Hudi数据集/管道 通过Ad...
  • Docker 示例

    Docker Demo A Demo using docker containers Prerequisites Setting up Docker Cluster Build Hudi Bringing up Demo Cluster Demo Step 1 : Publish the first batch to Kafka Step 2: ...
  • 使用案例

    使用案例 近实时摄取 近实时分析 增量处理管道 DFS的数据分发 使用案例 以下是一些使用Hudi的示例,说明了加快处理速度和提高效率的好处 近实时摄取 将外部源(如事件日志、数据库、外部源)的数据摄取到Hadoop数据湖 是一个众所周知的问题。 尽管这些数据对整个组织来说是最有价值的,但不幸的是,在大多数(如果不是全部)Hadoop部...
  • 管理

    Admin CLI {#admin-cli} 检查提交 深入到特定的提交 文件系统视图 统计信息 归档的提交 压缩 验证压缩 注意 取消调度压缩 修复压缩 指标 {#metrics} 故障排除 {#troubleshooting} 缺失记录 重复 Spark故障 {#spark-ui} 管理员/运维人员可以通过以下方式了解H...
  • 云储存

    云储存 与云存储连接 云储存 与云存储连接 无论使用RDD/WriteClient API还是数据源,以下信息都有助于配置对云存储的访问。 AWS S3 S3和Hudi协同工作所需的配置。 Google Cloud Storage GCS和Hudi协同工作所需的配置。 Alibaba Cloud OSS 阿里云和Hudi协同工作所需的配置。...
  • Alibaba Cloud OSS

    OSS Filesystem Aliyun OSS 部署 Aliyun OSS 相关的配置 Aliyun OSS Libs OSS Filesystem 这个页面描述了如何让你的Hudi spark任务使用Aliyun OSS存储。 Aliyun OSS 部署 为了让Hudi使用OSS,需要增加两部分的配置: 为Hidi增加Aliyu...
  • CREATE-EXTERNAL-TABLE

    CREATE-EXTERNAL-TABLE Name Description Example Keywords Best Practice CREATE-EXTERNAL-TABLE Name CREATE EXTERNAL TABLE Description This statement is used to create an ex...