书栈网 · BookStack 本次搜索耗时 0.013 秒,为您找到 72 个相关结果.
  • Analysis with HugeGraph-Spark

    HugeGraph-Spark Quick Start 1 概述 2 环境依赖 3 配置 3.1 配置项 3.2 配置入口 4 使用 4.1 生成 GraphX Graph RDD 4.2 使用 GraphX 进行图分析 获取顶点个数 获取边个数 出度 top 10 PageRank HugeGraph-Spark Quick ...
  • Pregel API

    Pregel API Pregel API 图本身是递归数据结构,顶点的属性依赖于它们邻居的属性,这些邻居的属性又依赖于自己邻居的属性。所以许多重要的图算法都是迭代的重新计算每个顶点的属性,直到满足某个确定的条件。一系列的graph-parallel抽象已经被提出来用来表达这些迭代算法。GraphX公开了一个类似Pregel的操作,它是广泛使用的Pr...
  • 开始

    开始 开始 开始的第一步是引入Spark和GraphX到你的项目中,如下面所示 mport org . apache . spark . _ import org . apache . spark . graphx . _ // To make some of the examples work we will also need RDD...
  • Spark 简介

    2829 2019-12-08 《大数据入门指南》
    Spark简介 一、简介 二、特点 三、集群架构 四、核心组件 3.1 Spark SQL 3.2 Spark Streaming 3.3 MLlib 3.4 Graphx # Spark简介 一、简介 Spark 于 2009 年诞生于加州大学伯克利分校 AMPLab,2013 年被捐赠给 Apache 软件基金会,2014...
  • 例子

    例子 例子 假定我们想从一些文本文件中构建一个图,限制这个图包含重要的关系和用户,并且在子图上运行page-rank,最后返回与top用户相关的属性。可以通过如下方式实现。 // Connect to the Spark cluster val sc = new SparkContext ( "spark://master.ampla...
  • 什么是 nebula-algorithm

    什么是 nebula-algorithm 实现方法 PageRank 和 Louvain 简介 PageRank Louvain 使用场景 什么是 nebula-algorithm nebula-algorithm 是一款基于 GraphX 的 Spark 应用程序,提供了 PageRank 和 Louvain 社区发现的图计算算法。使用...
  • 什么是 nebula-algorithm

    什么是 nebula-algorithm 实现方法 PageRank 和 Louvain 简介 PageRank Louvain 使用场景 什么是 nebula-algorithm nebula-algorithm 是一款基于 GraphX 的 Spark 应用程序,提供了 PageRank 和 Louvain 社区发现的图计算算法。使用...
  • 缓存操作

    缓存操作 缓存操作   在Spark 中,RDD 默认是不缓存的。为了避免重复计算,当需要多次利用它们时,我们必须显示地缓存它们。GraphX 中的图也有相同的方式。当利用到图多次时,确保首先访问Graph.cache() 方法。   在迭代计算中,为了获得最佳的性能,不缓存可能是必须的。默认情况下,缓存的RDD 和图会一直保留在内存中直到因为内存...
  • 宽度优先遍历

    广度优先遍历 广度优先遍历 val graph = GraphLoader . edgeListFile ( sc , "graphx/data/test_graph.txt" ) val root : VertexId = 1 val initialGraph = graph . mapVertices (( ...
  • 分布式图计算

    分布式图计算 1 图切分方式 2 图计算框架 2.1 BSP 2.1.1 BSP基本原理 2.1.2 BSP模型特点 2.2 Pregel 框架 2.2.1 Pregel 框架执行过程 2.2.1 Pregel 框架的消息模式 2.2.3 Pregel 框架的缺点 2.3 GraphLab 框架 2.3.1 GraphLab 框架的数据模...