[搜书籍] Spark - 搜索结果 - 书栈网

书栈网 · BookStack 本次搜索耗时 0.010 秒，为您找到 74 个相关结果.

[英文]Spark Gotchas

11 11809 2 2018-03-19

Unless explicitly stated otherwise this document is applicable to: - Apache Spark 2.0 or later. - Scala 2.11. - Python 3.5 or later.
Spark GraphX源码分析

19 39418 20 2018-04-17

Spark GraphX是一个新的Spark API，它用于图和分布式图(graph-parallel)的计算。GraphX 综合了 Pregel 和 GraphLab 两者的优点，即接口相对简单，又保证性能，可以应对点分割的图存储模式，胜任符合幂律分布的自然图的大型计算。
Databricks Spark 知识库

14 17493 20 2018-04-19

Databricks Spark 知识库简体中文版
Databricks Spark Reference Applications(英文)

34 22839 4 2018-04-15

At Databricks, we are developing a set of reference applications that demonstrate how to use Apache Spark. This book/repo contains the reference applications.
spark性能调优总结

8 43403 121 2018-04-19

Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架，Spark，拥有Hadoop MapReduce所具有的优点；但不同于MapReduce的是——Job中间输出结果可以保存在内存中，从而不再...
Apache Spark 的设计与实现

9 12854 94 2018-04-12

本文主要讨论 Apache Spark 的设计与实现，重点关注其设计思想、运行原理、实现架构及性能调优，附带讨论与 Hadoop MapReduce 在设计与实现上的区别。
Spark SQL, DataFrames and Datasets Guide v3.4.0

136 24083 8 2023-04-16

Spark SQL 是一个用于结构化数据处理的 Spark 模块。与基本的 Spark RDD API 不同，Spark SQL 提供的接口为 Spark 提供了有关数据结构和正在执行的计算的更多信息。
spark机器学习算法研究和源码分析

63 122406 104 2018-04-17

本项目对spark ml包中各种算法的原理加以介绍并且对算法的代码实现进行详细分析，旨在加深自己对机器学习算法的理解，熟悉这些算法的分布式实现方式。
Spark 编程指南简体中文版

69 92594 212 2018-02-05

Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架，Spark，拥有Hadoop MapReduce所具有的优点；但不同于MapReduce的是——Job中间输出结果可以保存在内存中，从而不再...
StreamX v1.2 中文文档

22 17052 9 2022-04-10

让流处理更简单！ Flink & Spark 开发脚手架，StreamX 的初衷是为了让 Flink 的开发更简单。 StreamX 专注于开发阶段和任务的管理。我们的最终目标是打造集流处理、批处理、数据仓库和数据湖为一体的一站式大数据解决方案。