书栈网 · BookStack 本次搜索耗时 0.019 秒,为您找到 3983 个相关结果.
  • Kafka

    Kafka Kafka While the previous example picks up new log files right away - the logfiles aren’t copied over until a long time after the HTTP requests in the logsactually occurre...
  • 导入Hive数据

    导入Hive数据 数据集 环境配置 前提条件 操作步骤 步骤 1:在Nebula Graph中创建Schema 步骤 2:使用Spark SQL确认Hive SQL语句 步骤 3:修改配置文件 步骤 4:向Nebula Graph导入数据 步骤 5:(可选)验证数据 步骤 6:(如有)在Nebula Graph中重建索引 导入Hiv...
  • Weather TimeSeries Data Application with Cassandra

    Weather TimeSeries Data Application with Cassandra Time Series Data Weather TimeSeries Data Application with Cassandra This project demonstrates how to easily leverage and int...
  • Zeppelin

    719 2019-07-24 《MLeap 中文文档》
    Zeppelin MLeap 配置 Zeppelin MLeap 配置 Zeppelin 默认已经能跑 Spark,我们不会在本节讲解如何配置一个 Zeppelin Notebook。一旦已经配置好 Zeppelin,那么添加 MLeap 依赖就会十分简单。 MLap 已经被托管在 Maven Central 上,所以你需要做的只是添加: ml...
  • 配置Kinesis

    Kinesis集成指南 配置Kinesis 配置Spark Streaming应用程序 运行实例 Kinesis Checkpointing Kinesis集成指南 亚马逊Kinesis是一个实时处理大规模流式数据的全托管服务。Kinesis receiver应用Kinesis客户端库(KCL)创建一个输入DStream。KCL由亚马逊提供,...
  • 部署应用程序

    部署应用程序 Requirements 升级应用程序代码 部署应用程序 Requirements 运行一个Spark Streaming应用程序,有下面一些步骤 有管理器的集群-这是任何Spark应用程序都需要的需求,详见部署指南 将应用程序打为jar包-你必须编译你的应用程序为jar包。如果你用spark-submit 启动应用程序,...
  • Google Dataproc

    Running Alluxio on Google Cloud Dataproc Overview Prerequisites Basic Setup Next steps Spark on Alluxio in Dataproc Presto on Alluxio in Dataproc Running Alluxio on Googl...
  • 代码结构

    Angel的代码框架 1. Angle-Core(核心层) 2. Angel-ML(机器学习层) 3. Angel-Client(接口层) 4. Angle-MLLib(算法层) Angel的代码框架 Angel的代码结构,从整体上可以划分为几大模块: 1. Angle-Core(核心层) Angel的核心层,包括了如下核心组件:...
  • 部署依赖

    部署依赖 集群依赖 spark thrift flinkx maven依赖 构建依赖 编辑器依赖 部署依赖 集群依赖 spark thrift 下载spark 安装包,我们选择的是spark2.1.3b 解压spark-2.1.3-bin-hadoop2.7.tgz 将core-site.xml、hdfs-site.xml、yarn...
  • 一、概述

    一、概述 一、概述 spark sql 是用于操作结构化数据的程序包 通过spark sql ,可以使用SQL 或者 HQL 来查询数据,查询结果以Dataset/DataFrame 的形式返回 它支持多种数据源,如Hive 表、Parquet 以及 JSON 等 它支持开发者将SQL 和传统的RDD 变成相结合 Dat...