书栈网 · BookStack 本次搜索耗时 0.013 秒,为您找到 1913 个相关结果.
  • Presto 0.237 Documentation

    Presto是Facebook最新研发的数据查询引擎,可对250PB以上的数据进行快速地交互式分析。据称该引擎的性能是 Hive 的 10 倍以上。 PrestoDB 是 Facebook 推出的一个大数据的分布式 SQL 查询引擎。可对从数 G 到数 P 的大数据进行交互式的查询,查询的速度达到商业数据仓库的级别。Presto 可以查询包括 Hive、Ca...
  • Presto 0.268 Documentation

    Presto是Facebook最新研发的数据查询引擎,可对250PB以上的数据进行快速地交互式分析。据称该引擎的性能是 Hive 的 10 倍以上。 PrestoDB 是 Facebook 推出的一个大数据的分布式 SQL 查询引擎。可对从数 G 到数 P 的大数据进行交互式的查询,查询的速度达到商业数据仓库的级别。Presto 可以查询包括 Hive、Ca...
  • Taier(太阿)v1.2 使用教程

    Taier 是一个分布式可视化的DAG任务调度系统。旨在降低ETL开发成本、提高大数据平台稳定性,大数据开发人员可以在 Taier 直接进行业务逻辑的开发,而不用关心任务错综复杂的依赖关系与底层的大数据平台的架构实现,将工作的重心更多地聚焦在业务之中。
  • ClickHouse v21.9 Documentation

    俄罗斯第一大搜索引擎Yandex开发的列式储存数据库. 令人意外的是,这个列式储存数据库的性能大幅超越了很多商业MPP数据库软件,比如Vertica,InfiniDB.
  • Pandora中文文档手册

    Pandora是一套面向海量数据,基础技术人员的,管理大数据传输、计算、存储和分析的大数据平台。
  • ELK Stack权威指南

    Elasticsearch+Logstash+Kibana一站式数据分析解决方案,快速应对大数据时代的数据收集、检索、可视化。从基础部署到千亿级扩展方案,从性能优化到插件开发,从数据模型到源码解析,全方位解析ELK,融入了作者多年大型网站运维开发的实战经验。
  • pandas 0.25.3 documentation

    pandas 是连接 SciPy 和 NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。Comma-separated values (CSV) 文件表示在有关各方之间分发数据的最常见的方法之一。Pandas 提供了一种优化库功能来读写多种文件格式,包括 CSV...
  • ClickHouse v20.10 Documentation

    ClickHouse是俄罗斯第一大搜索引擎Yandex开发的列式储存数据库.令人惊喜的是,这个列式储存数据库的性能大幅超越了很多商业MPP数据库软件,比如Vertica,InfiniDB. 相比传统的数据库软件,ClickHouse要快100-1000X
  • Apache Drill 1.4 参考手册

    Drill 是 Apache 开源的,用于大数据探索的 SQL 查询引擎。她在大数据应用中,面对结构化数据和变化迅速的数据,她能够去兼容,并且高性能的去分析,同时,还提供业界都熟悉的标准的查询语言,即:ANSI SQL 生态系统。Drill 提供即插即用,在现有的 Hive 和 HBase中可以随时整合部署。
  • Taier(太阿)v1.0 使用教程

    Taier 是一个分布式可视化的DAG任务调度系统。旨在降低ETL开发成本、提高大数据平台稳定性,大数据开发人员可以在 Taier 直接进行业务逻辑的开发,而不用关心任务错综复杂的依赖关系与底层的大数据平台的架构实现,将工作的重心更多地聚焦在业务之中。