书栈网 · BookStack 本次搜索耗时 0.018 秒,为您找到 1513 个相关结果.
  • 基于 MySQL 的 Metastore 配置

    准备工作 配置方法 Kylin 支持 MySQL 作为 Metastore 存储。 准备工作 1.安装 MySQL 服务,例如 v5.1.172.下载 MySQL 的 JDBC 驱动 ( mysql-connector-java-<version>.jar ) 并放置到 $KYLIN_HOME/ext/ 目录下。 提示:如果没有该目录,请自行...
  • 使用案例

    使用案例 近实时摄取 近实时分析 增量处理管道 DFS的数据分发 使用案例 以下是一些使用Hudi的示例,说明了加快处理速度和提高效率的好处 近实时摄取 将外部源(如事件日志、数据库、外部源)的数据摄取到Hadoop数据湖 是一个众所周知的问题。 尽管这些数据对整个组织来说是最有价值的,但不幸的是,在大多数(如果不是全部)Hadoop部...
  • 使用案例

    使用案例 近实时摄取 近实时分析 增量处理管道 DFS的数据分发 使用案例 以下是一些使用Hudi的示例,说明了加快处理速度和提高效率的好处 近实时摄取 将外部源(如事件日志、数据库、外部源)的数据摄取到Hadoop数据湖 是一个众所周知的问题。 尽管这些数据对整个组织来说是最有价值的,但不幸的是,在大多数(如果不是全部)Hadoop部...
  • 使用案例

    使用案例 近实时摄取 近实时分析 增量处理管道 DFS的数据分发 使用案例 以下是一些使用Hudi的示例,说明了加快处理速度和提高效率的好处 近实时摄取 将外部源(如事件日志、数据库、外部源)的数据摄取到Hadoop数据湖 是一个众所周知的问题。 尽管这些数据对整个组织来说是最有价值的,但不幸的是,在大多数(如果不是全部)Hadoop部...
  • 使用案例

    使用案例 近实时摄取 近实时分析 增量处理管道 DFS的数据分发 使用案例 以下是一些使用Hudi的示例,说明了加快处理速度和提高效率的好处 近实时摄取 将外部源(如事件日志、数据库、外部源)的数据摄取到Hadoop数据湖 是一个众所周知的问题。 尽管这些数据对整个组织来说是最有价值的,但不幸的是,在大多数(如果不是全部)Hadoop部...
  • 使用案例

    使用案例 近实时摄取 近实时分析 增量处理管道 DFS的数据分发 使用案例 以下是一些使用Hudi的示例,说明了加快处理速度和提高效率的好处 近实时摄取 将外部源(如事件日志、数据库、外部源)的数据摄取到Hadoop数据湖 是一个众所周知的问题。 尽管这些数据对整个组织来说是最有价值的,但不幸的是,在大多数(如果不是全部)Hadoop部...
  • 版本发布

    概览 安装构建 立即开始 社区分享: 概览 Pegasus是小米云存储团队开发的一个分布式Key-Value存储系统,最初的动机是弥补HBase在可用性和性能上的不足。Pegasus系统的Server端完全采用C++语言开发,使用PacificA协议支持强一致性,使用RocksDB作为单机存储引擎。 因为使用C++编写,Pegasus避免了使...
  • 总览

    总览 简介 特性 多租户系统 分发任务支持动态更新 缓存层支持的消息队列 支持的数据存储 未来规划 支持更多种类的缓存层消息队列 支持更多种类的数据存储 支持更多种写入Apache Hive的文件格式 总览 简介 Inlong-sort-standalone是一个负责将用户上报的数据流从缓存层消费出来,分发到不同数据存储的模块,支...
  • 使用案例

    近实时摄取 近实时分析 增量处理管道 DFS的数据分发 近实时摄取 将外部源(如事件日志、数据库、外部源)的数据摄取到Hadoop数据湖 是一个众所周知的问题。 尽管这些数据对整个组织来说是最有价值的,但不幸的是,在大多数(如果不是全部)Hadoop部署中都使用零散的方式解决,即使用多个不同的摄取工具。 对于RDBMS摄取,Hudi提供 通过...
  • 5.课程2:使用 ANSI SQL 查询

    课程2:使用 ANSI SQL 查询 目标 查询 聚合 切换到 hive 的 schema: 按月返回销售总量: 按 month 和 state 字段分组,返回前 20 行销售总额: HAVING 语法 切换到 dfs.clicks 工作区间 按设备分组,设备点击数高过一定阀值的总数: UNION 操作 clicks 和 campaign ...