书栈网 · BookStack 本次搜索耗时 0.024 秒,为您找到 48330 个相关结果.
  • 用 Spark 构建 Cube

    用 Spark 构建 Cube 准备阶段 安装 Kylin v2.1.0 及以上版本 准备 “kylin.env.hadoop-conf-dir” 检查 Spark 配置 创建和修改样例 cube 用 Spark 构建 Cube 通过Apache Livy使用Spark 可选功能 疑难解答 进一步 用 Spark 构建 Cube ...
  • Spark Streaming 基本操作

    1629 2019-12-08 《大数据入门指南》
    Spark Streaming 基本操作 一、案例引入 2.2 updateStateByKey 2.3 启动测试 三、输出操作 3.1 输出API 3.1 foreachRDD 3.3 代码说明 3.4 启动测试 参考资料 Spark Streaming 基本操作 一、案例引入 这里先引入一个基本的案例来演示流的创建:获取指定...
  • Spark 开发环境搭建

    1812 2019-12-08 《大数据入门指南》
    Spark开发环境搭建 一、安装Spark 1.1 下载并解压 1.2 配置环境变量 1.3 Local模式 二、词频统计案例 三、Scala开发环境配置 3.1 前置条件 3.2 安装Scala插件 3.3 创建Scala项目 3.4 下载Scala SDK 1. 方式一 2. 方式二 3.5 创建Hello World 3.6 切...
  • 编译 Nebula Spark Connector

    编译 Nebula Spark Connector 编译 Nebula Spark Connector 按以下步骤编译 Nebula Spark Connector v1.x: 克隆 nebula-java 源代码。 git clone - b v1 . 0 https : //github.com/vesoft-inc/nebula-ja...
  • 4.2.1. Spark组件

    操作步骤 Spark 组件是面向使用 Scala/Java 的 Spark 用户,用户编写 Spark 应用程序并编译打包成 jar 后,可通过 Spark 组件完成部署。 操作步骤 添加组件 从左侧菜单栏中,选择【组件】>【机器学习】列表下的 Spark 节点,并将其拖拽至画布中。 配置参数 作业 Jar 包:通过该配置框上传您的 S...
  • 部署Spark Standalone集群

    部署Spark Standalone集群 部署步骤 部署单实例的master服务 部署多实例的worker实例 Spark数据读取 Master节点主备高可用 部署Spark Standalone集群 Standalone 是 Spark 自身提供的一种主从集群部署模式。本文讲述一个常规1主多从的集群部署模式,该模式下master服务依靠Ra...
  • Seatunnel Connector Spark Doris

    SeaTunnel 安装 SeaTunnel SeaTunnel 安装链接 Spark Sink Doris 插件代码 参数列表 Examples SeaTunnel 最新版本的 Apache SeaTunnel (原 waterdrop ) 已经支持 Doris 的连接器, SeaTunnel 可以用过 Spark 引擎和 Flink...
  • Apache Druid vs Spark

    Apache Druid vs Spark Apache Druid vs Spark Druid and Spark are complementary solutions as Druid can be used to accelerate OLAP queries in Spark. Spark is a general cluster com...
  • Apache Druid vs Spark

    Apache Druid vs Spark Apache Druid vs Spark Druid and Spark are complementary solutions as Druid can be used to accelerate OLAP queries in Spark. Spark is a general cluster com...
  • Analysis with HugeGraph-Spark

    HugeGraph-Spark Quick Start 1 概述 2 环境依赖 3 配置 3.1 配置项 3.2 配置入口 4 使用 4.1 生成 GraphX Graph RDD 4.2 使用 GraphX 进行图分析 获取顶点个数 获取边个数 出度 top 10 PageRank HugeGraph-Spark Quick ...