书栈网 · BookStack 本次搜索耗时 0.018 秒,为您找到 59 个相关结果.
  • Apache Kylin v4.0 使用教程

    Apache Kylin™是一个开源的分布式分析引擎,提供Hadoop之上的SQL查询接口及多维分析(OLAP)能力以支持超大规模数据,最初由eBay Inc.开发并贡献至开源社区。
  • Apache Kudu 1.4.0 中文文档

    Kudu 是一个针对 Apache Hadoop 平台而开发的列式存储管理器。Kudu 共享 Hadoop 生态系统应用的常见技术特性: 它在 commodity hardware(商品硬件)上运行,horizontally scalable(水平可扩展),并支持 highly available(高可用)性操作。
  • Apache HAWQ v2.3.0 Document

    Apache HAWQ是一个高级SQL-on-Hadoop弹性查询引擎和分析型数据库。它结合了MPP数据库的关键技术优势和Hadoop的可扩展性。HAWQ可以从原生访问HDFS数据,并提供业界领先的性能和线性可扩展性。支持PB级数据交互式查询,并为用户提供了完整的、符合标准的SQL接口。
  • Apache HAWQ v2.3 Documentation

    Apache HAWQ is Apache Hadoop Native SQL. Advanced Analytics MPP Database for Enterprises.
  • ZooKeeper深入浅出

    Zookeeper是Hadoop分布式调度服务,用来构建分布式应用系统。构建一个分布式应用是一个很复杂的事情,主要的原因是我们需要合理有效的处理分布式集群中的部分失败的问题。
  • Spark 编程指南简体中文版

    Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架,Spark,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是——Job中间输出结果可以保存在内存中,从而不再...
  • spark性能调优总结

    Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架,Spark,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是——Job中间输出结果可以保存在内存中,从而不再...
  • 大数据实验手册

    这是一本关于大数据学习记录的手册,主要针对初学者.做为一个老IT工作者,学习是一件很辛苦的事情.希望这本手册对帮助大家快速的学习与认识大数据(特指Hadoop Spark),为了不让初学者一下接触爆炸式的新概念,我们会以实验先行,概念跟进的方式进行课程学习,这样有利于大家快速进入状态,而不至于一直深陷逻辑概念出不来,但是每个人的学习方式不一样,仁者见仁智者见...
  • Apache Impala v4.0 Documentation

    Apache Impala是一个开源的大规模并行处理SQL查询引擎,用于存储在运行Apache Hadoop的计算机集群中的数据。
  • Apache Impala v3.x Documentation

    Apache Impala是一个开源的大规模并行处理SQL查询引擎,用于存储在运行Apache Hadoop的计算机集群中的数据。